PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT

Rozměr: px
Začít zobrazení ze stránky:

Download "PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT"

Transkript

1 PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Expermentální data se v analytcké laboratoř často vyznačují nekonstantním rozptylem, malou četností, asymetrckým rozdělením a porušením základních předpokladů, kladených na výběr. Uveďme nejprve 3 etapy obecné osnovy analýzy výběru dat. A. V průzkumové analýze dat se vyšetřují statstcké zvláštnost dat, jako je lokální koncentrace dat, tvarové zvláštnost rozdělení dat a přítomnost podezřelých hodnot. Odhalí se také anomále a odchylky rozdělení výběru od typckého rozdělení, obyčejně normálního č Gaussova. Interaktvní statstcká analýza na počítač tento postup ulehčuje, většna statstckého software nabízí řadu dagnostckých grafů a dagramů. Pokud je rozdělení dat nevhodné pro standardní statstckou analýzu (tj. většnou je asymetrcké), provádí se nejprve vhodná transformační úprava dat. Pokud bylo ndkováno seškmené rozdělení nebo rozdělení s dlouhým konc, pomocníkem je mocnnná a Boxova-Coxova transformace. Transformace je vhodná především př asymetr rozdělení původních dat, ale také př nekonstantnost rozptylu. B. Pro případ rutnních měření se ověří základní předpoklady, kladené na výběr, jako jsou nezávslost prvků, homogenta výběru, dostatečný rozsah výběru a rozdělení výběru. Jsou-l závěry tohoto kroku optmstcké, následuje vyčíslení klasckých odhadů polohy a rozptýlení, tj. obyčejně artmetckého průměru a rozptylu. Dále se vyčíslí ntervaly spolehlvost, následované testováním statstckých hypotéz. V pesmstckém případě následuje další pokus o úpravu dat. C. V konfrmatorní analýze je nabízena paleta rozlčných odhadů polohy, rozptýlení a tvaru, jež lze rozdělt do dvou skupn: na klascké odhady anarobustní odhady (nectlvé na odlehlé prvky výběru, resp. další předpoklady o datech). Z nabídky odhadů parametrů vybírá užvatel uvážlvě ty, jež mají statstcký smysl a odpovídají závěrům průzkumové analýzy dat a ověření předpokladů ovýběru. 1, 3, 5 Postup statstcké analýzy jednorozměrných dat, prováděné v nteraktvním režmu na počítačlzeshrnout do bloků operací, když lze jednotlvé operace provádět samostatně: operace A, operace B, operace A+B, operace B+C a konečně všechny operace A+B+C. Přehled operací analýzy jednorozměrných dat A. Průzkumová (exploratorní) analýza dat (EDA): Odhalení stupně symetre a špčatost výběrového rozdělení; Indkace lokální koncentrace výběru dat; Nalezení vybočujících a podezřelých prvků ve výběru; Porovnání výběrového rozdělení dat s typckým rozdělením; Mocnnná transformace výběru dat; Box-Coxova transformace výběru dat. B. Ověření předpokladů o datech: Ověření nezávslost prvků výběru dat; Ověření homogentyrozdělení výběru dat; Určení mnmálního rozsahu výběru dat; Ověření normalty rozdělení výběru dat. C. Konfrmatorní analýza dat (CDA) - odhady parametrů (polohy, rozptýlení a tvaru) 1. Klascké odhady (bodové a ntervalové) výběru dat;. Robustní odhady (bodové a ntervalové) výběru dat.

2 Vzorováúloha.1 Analýza dat normálního a log.-normálního rozdělení Analýza smulovaných dat výběru, pocházejícího z (a) rozdělení normálního norm N(10, 0.1) az(b) rozdělení logartmcko-normálního log L(5, ). Data: (a) Výběr norm: (b) Výběr log: Řešení: u jednotlvých dagnostckých dagramů a grafů budou uvedeny vždy dvě ukázky, jednak pro výběr ze symetrckého normálního rozdělení norm N(10, 0.1) a jednak pro výběr z asymetrckého logartmckonormálního rozdělení log L(5, ). Čtenář může porovnat, jak jednotlvé dagnostcké pomůcky montorují symetrcké a slně asymetrcké rozdělení..1 Průzkumová (exploratorní) analýza dat EDA Prvnímkrokemvanalýze jednorozměrných dat je průzkumová čl exploratorní analýza. Vychází se z pořádkových statstk výběru tj. z prvků výběru, uspořádaných vzestupně x (1) # x () #... # x (n). Platí, že střední hodnota -té pořádkové statstky E(x ) je rovna 100P procentnímu kvantlu výběrového rozdělení Q(P ) a symbol P. /(n + 1) () označuje pořadovou pravděpodobnost. Přpomeňme, že 100P procentní výběrový kvantl je hodnota, pod kterou leží 100P procent prvků výběru. Vynesením hodnot x() prot P, = 1,..., n, sezíská hrubý odhad kvantlové funkce Q(P ). Tajenverzní k funkc dstrbuční F(x ) a charakterzuje jednoznačně rozdělení výběru. Pro lbovolnou hodnotu α z ntervalu [0, 1] lze vyčíslt 100α%ní kvantl x α pomocí lneární nterpolace x α (n 1) α n 1 (x (1) x () ) x () kde pro ndex musí být splněna nerovnost α 1. Pro rozptyl kvantlu x n 1 n 1 α, určeného z výběru α (1 α) velkost n, platí vztah D( x α ), kde f( x n [ f( x α )] α )je výběrová hodnota hustoty pravděpodobnost v bodě x α. - Vprůzkumové analýze se často používá specálních kvantlů L pro pořadové pravděpodobnost P =, =1,,...,kterése také nazývají písmenové hodnoty. -tý kvantl Pořadová pravděpodobnost P 1 Medán -1 =1/ Kvartly - = 1 / 4 3 Oktly -3 = 1 / 8 4 Sedecly -4 = 1 / 16 Písmenová hodnota L Symbol u P označuje kvantl normovaného normálního rozdělení N(0, 1). Kromě medánu ( =1)exstují pro každé > 1 dvojce kvantlů, atodolní a horní písmenová hodnota LD a L.Dolní H písmenová hodnotajepropořadovou - - pravděpodobnost P=,zatímco horní je pro P=1-. M F E D

3 Pro odhad písmenových hodnot lze použít jednoduché technky pořadí a hloubek. Pořádková statstka x() má rostoucí pořadí R P =aklesající pořadí K P = n Hloubka H je pak menší číslo z obou pořadí H mn(r P, K P ). Pro hloubku medánu platí H M n 1. Pokud je tato hloubka celé číslo, je medán x 0.5 M x (HM ). Vopačném případě se provádí lneární nterpolace mez x(n/) a x (n/+1). Hloubky dolních písmenných hodnot jsou H L [1 nt (H L1 )]/, kde L jsou ndexy F, E, D ant(x)značí celočíselnou část čísla x. Pokud je L = F,bereseL -1=M.Jestlže jehl celé číslo, bude dolní kvantl L D = x(h ahorní kvantl L = x L ) H (n+1- H. Je-l H číslo necelé, provádí se lneární nterpolace podle vztahů L ) L L D x x nt(h L ) nt(hl )1 L H x x n 1 nt(h L ) n nt(hl ) a. Tento postup se pro menší hodnoty H,kdy L jsou kvantly blízko hodnot x(1) a x (n), považujezarobustnější. Počet písmenových hodnot závsí na rozsahu výběru. Pro velkost výběru n lze určt nl písmenových hodnot včetně medánu. Platí, že n L ln(n 1). Obr..1 Grafcko-tabelární schéma sumarzace dat: (a) obecné schéma písmenově-číslcového zápsu výběru, (b) sedmpísmenový záps výběru {36, 37, 45, 5, 56, 58, 66, 68, 75, 90, 100}. Mez základní statstcké zvláštnost rozdělení dat patří symetre výběrového rozdělení a jeho relatvní délky konců ve srovnání snormálnímrozdělením. K vyjádření symetre a špčatost v různých vzdálenostech od medánu se užívají jednoduché funkční charakterstky, založené na písmenových hodnotách. Ze vztahu pro délku konců T L vnásledující tabulce lze snadno určt jejch teoretcké velkost pro vybraná symetrcká rozdělení, ato(t,t) E D hodnoty: normální rozdělení (0.534; 0.8), rovnoměrné rozdělení (0.405; 0.559) a Laplaceovo rozdělení (0.693; 1.098). Pro rozdělení seškmená kvyšším hodnotám jsou hodnotyškmost SL záporné, př seškmení knžším hodnotám jsou kladné (vz tabulka Charakterstk škmost a špčatost výběrového rozdělení). Pro rozdělení sdelším konc než má normální rozdělení rostou hodnoty pseudosgmy GL se vzdáleností od medánu. Když hodnoty GL klesají srostoucívzdáleností od medánu, má výběrové rozdělení kratší konce než normální. K posouzení statstckých zvláštností dat se používá různých grafů, využívajících charakterstk z tabulky. Pro větší výběry se v grafech znázorňují pouze funkce písmenových hodnot, zatímco pro menší výběry se využívá všech kvantlů x P = x() obyčejně přvolbě P [ 0.333]/[n 0.333]. Charakterstky škmost a špčatost výběrového rozdělení Název Defnce Charakterzuje Platí pro L Polosuma ZL 0.5 (L D+ L H) symetr př Z L=0 F, E, D,... Rozpětí R L (LH-L D) rozptýlení F, E, D,... Škmost S L (M-Z)/R L L symetr př S L=0 F, E, D,... *) Pseudosgma GL R L/ (- up špčatost (Gaussovo G =konst.) F, E, D,... ) L Délky konců TL ln (R L/ R F) špčatost E, D *) u P je kvantl standardzovaného normálního rozdělení pro P =-.

4 Dagram rozptýlení (osa x: hodnotyx, osa y: lbovolná úroveň, např. y = 0). Představuje jednorozměrnou projekc kvantlového grafu do osy x. I př své jednoduchost ukazuje na lokální koncentrace dat a ndkuje podezřelá avybočující měření. Obr.. Dagram rozptýlení a rozmítnutý dagram rozptýlení pro výběry (shora dolu): (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Rozmítnutý dagram rozptýlení (osa x: hodnotyx, osay: nterval náhodných čísel). Dagram představuje rovněž projekc kvantlového grafu, body jsou však pro lepší přehlednost vhodně rozmítnuté. 14,0 Dot Plot 9,3 4,7 0,0 log Varables Obr..3 Rozmítnutý dagram rozptýlení pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, NCSS000 Dagram percentlů (osa x: proměnná, osa y: percently). Dagram zobrazuje vybrané percently. Jsou to obvykle ntervaly 0-, -5, 5-10, 10-15, 15-5, 5-35, 35-45, 45-55, 55-65, 65-75, 75-85, 85-90, 90-95, 95-99, Z výsledného obrazce lze usoudt na symetr rozdělení nebo na jeho tvar. Obr..4 Dagram některých percentlů pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, NCSS000

5 Houslový dagram (osa x: název výběru proměnné, osay: percently, hodnoty proměnné). Dagram je kombnací krabcového grafu a dvou vertkálních, zrcadlově k sobě zobrazených grafů hustoty. Jeden graf hustoty roste směrem doprava a druhý doleva. Dagram zobrazuje píky a údolí stejně jako graf hustoty pravděpodobnost. Medán je zobrazen černým kolečkem a začátek a konec úsečky zobrazuje dolní a horní kvantl. Houslový dagram se jmenuje dle přpomínajícího tvaru houslí. Normální rozdělení se projeví v symetrckém tvaru houslí zatímco log.-normální v slně asymetrckémtvaru. 14,0 Voln Plot 9,3 4,7 0,0 log Varables Obr..5 Houslový dagram pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, NCSS000 Krabcový graf (osa x: úměrná hodnotám x, osay: nterval úměrný hodnotě n). Pro částečnou sumarzac dat lze využít krabcového grafu, který umožňuje znázornění robustního odhadu polohy, medánu M, dále posouzení symetre v okolí kvartlů, posouzení symetre u konců rozdělení, akonečně dentfkac odlehlých dat. Krabcový graf je obdélník odélce R F= FH - FD s vhodně zvolenou šířkou, která je úměrná hodnotě n. Vmístě medánu M je vertkální čára. Odobouprotlehlých stran tohoto obdélníku pokračujíúsečky. Ty jsou ukončeny vntřním hradbam B H, B D, pro které platí B H F H 1.5 R F, B D F D 1.5 R F. Prvky výběru, ležící mmo nterval vntřních hradeb [B H,B,] D jsoupovažovány za podezřelé, obvykle vybočující body, v grafu jsou znázorněny kroužky. Obr..7 Vrubový krabcový graf pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Vrubový krabcový graf (osa x: úměrná hodnotám x, osay: nterval úměrný hodnotě n). Obdobou krabcového grafu je vrubový krabcový graf, který umožňuje také posouzení varablty medánu. Tajetotž vyjádřena dolní a horní mezí ntervalu spolehlvost medánu, ID M I H, který bývá znázorněn vokolí medánu bílým proužkem.

6 Graf polosum (osa x: pořádkové statstky x, osa y: Z = 0.5 (x + x )). () (n + 1 -) () Obr..8 Graf polosum pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmckonormálního) rozdělení, ADSTAT Pro symetrcké rozdělení je grafem polosum horzontální přímka, určená rovncí y = M. U tohoto grafu je důležté, že zde body osclují okolo horzontální přímky a vykazují tak náhodný shluk (mrak) a měřítko y-nové osy je slně detalní. Naopak asymetrcké rozdělení vykazuje nenáhodný trend a body pak neosclují okolo horzontální přímky aměřítko y-nové osy není detalní. Graf symetre (osa x: M-x (),osay: x(n+1-) - M). Symetrcká rozdělení jsou charakterzována přímkou y = x. Pro asymetrcké rozdělení tato přímka nemá nulovou směrnc a v tomto grafu směrnce je odhadem parametru škmost. Asymetrcké rozdělení vykazuje body uspořádané vtrendunějaké křvky. Obr..9 Graf symetre pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmckonormálního) rozdělení, ADSTAT Obr..11 Graf špčatost pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT

7 ˆµ ˆσ u P Kvantlový graf (osa x: pořadová pravděpodobnost P,osay: pořádková statstka x ()). Umožňuje přehledně znázornt data a snadněj rozlšt tvar rozdělení, které může být symetrcké, seškmené kvyššímnebonžšímhod- notám. Ke snadnějšímu porovnání snormálnímrozdělením se do tohoto grafu zakreslují kvantlové funkce normálního rozdělení, N P = +, pro 0 P 1: (1) klasckých odhadů parametrů polohy a rozptýlení, tj. artmetckého průměru a směrodatné odchylky ˆµ = x a ˆσ = s, adále () robustních odhadů, tj. medánu M, ˆµ = M a ˆσ = R /1.349, kde R = F - F je nterkvartlové rozpětí. F F H D Obr..6 Kvantlový graf (robustní --- a klascký...) pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Graf rozptýlení s kvantly (osa x: P,osay: x ()). Základem je odhad kvantlové funkce výběru, který se získá spojením bodů {x(), P} lneárním úseky. Pro symetrcká rozdělení má kvantlová funkce sgmodální tvar. Pro rozdělení seškmená kvyšším hodnotám je konvexně rostoucí a pro rozdělení seškmená knžším hodnotám konkávně rostoucí. Obr..1 Graf rozptýlení s kvantly pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Do grafu se zakreslují tř pomocné kvantlové obdélníky: - (a) Kvartlový obdélník F:na y ose kvartly FD a FH anaosexpořadové pravděpodobnost P = = 0.5a1- - = (b) Oktlový obdélník E:nay ose oktly ED a EH anaosex pořadové pravděpodobnost P 3 = = 0.15a1- -3 = (c) Sedeclový obdélník D:nay ose sedecly D D, DH anaxose pořadové pravděpo-dobnost P 4 = = a 1 - = Graf rozptýlení s kvantly poskytuje následující závěry vyšetření dat: 1. Symetrcké unmodální rozdělení výběru obsahuje obdélníky symetrcky uvntř sebe.. Nesymetrcká rozdělení mají pro rozdělení seškmené kvyšším hodnotám vzdále-nost mez dolním hranam obdélníků F, E a D výrazně kratší než mez jejch horním.

8 3. Odlehlá pozorování jsou ndkována tím, že na kvantlové funkc mmo obdélník D se objeví náhlý vzrůst, kdy hodnota směrnce roste praktcky nade všechny meze. 4. Vícemodální rozdělení jsou ndkována tím, že na kvantlové funkc uvntř obdélníku F je několk úseků s téměř nulovým směrncem. Hstogram (osa x: proměnná x, osay: uměrná hustotě pravděpodobnost). Jde o obrys sloupcového grafu, kde jsou na ose x jednotlvé třídy, defnující šířky sloupců, avýšky sloupců odpovídají emprckým hustotám pravděpodobnost. Kvaltu hstogramu ovlvňujeveznačné míře volbapočtu tříd L. Pro přblžně symetrcká rozdělení výběru lze vyčíslt počet tříd L podle vztahu L = nt( n), kde funkce nt(x) označuje celočíselnou část čísla x. Všrokém rozmezí velkostí výběrů n užjeme výraz L nt (.46 (n 1) 0.4 ). Obr..13 Hstogram pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmckonormálního) rozdělení, ADSTAT Pro malé a střední výběry se konstruují jádrové odhady hustoty podle vztahu f(x) ˆ 1 j n K (x x ) j, kde šířka pásu h určuje stupeň vyhlazení. Jádrová funkce K(x) je symetrcká nh 1 h kolem nuly a má všechny vlastnost hustoty pravděpodobnost. Vhodná je t.zv. bkvadratcká funkce K(x) (1 x ) pro 1 x 1 K(x) 0 pro x mmo nterval 1 x 1 O kvaltě odhadu hustoty pravděpodobnost rozhoduje volba parametru h. Provýběry velkost n zpřblžně normálního rozdělení se známýmrozptylemσ je optmálníšířka pásu h opt.34 σ n 0.. Jádrový odhad hustoty pravděpodobnost (osa x: proměnná x, osay: hustota pravděpodobnost ˆf (x)). Obr..14 Jádrový odhad hustoty pravděpodobnost pro výběry. Emprcká křvka rozdělení (čárkovaně) a aproxmační křvka Gaussova rozdělení (plná čára): (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT

9 Kvantl-kvantlový graf (graf Q-Q) (osa x: Q(P), T osay: x ()). Umožňují posoudt shodu výběrového rozdělení, jež je charakterzováno kvantlovou funkcí Q(P)s E kvantlovou funkcí zvoleného teoretckého rozdělení Q(P). T Obr..15 Ranktový čl kvantl-kvantlový graf (Q-Q graf) pro ověření shody s teoretckýmnormálnímrozdělením: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Jako odhad kvantlové funkce výběru se využívají pořádkové statstky x ().Př shodě výběrového rozdělení se zvoleným teoretckým rozdělením platí přblžná rovnost kvantlů x (). Q T (P ), kde P je pořadová pravděpodobnost a závslost x na Q(P)je přblžně přímka. Korelační koefcent r je pak krtérem těsnost () T xy proložení této přímky př hledání typu neznámého rozdělení. Ranktový graf (osa x: kvantl normovaného Gaussova rozdělení up, osa y: x ()). Pro porovnání rozdělení výběru srozdělenímnormálnímseq-q graf nazývá grafem ranktovým. Umožňuje také orentační zařazení výběrového rozdělení do skupn podle škmost, špčatost a délky konců. -1 Podmíněný ranktový graf (osa x: Φ [0.5 (U(-1) + U (+1))], osay: x ()). K ověření normalty výběrového rozdělení -1 se užívá podmíněný ranktový graf. Symbol Φ (U) značí standardzovanou kvantlovou funkc normálního rozdělení. Hodnoty U=Pjsou přímo kvantly up. Pořádkové statstky U() jsou uspořádané náhodné proměnné U defnované vztahem U Φ x ˆµ R / ˆσ R, kde symbol Φ(x) značí dstrbuční funkc standardzovaného normálního rozdělení. Robustní odhad polohy je roven medánu ˆµ R = x 0.5 arobustní směrodatná odchylka se vyčíslí vztahem ˆσ R = 0.75( x x 0.5 ).Proúplnou defnc se volí U (0) = 0aU (n+1) = 1.Přblžná lneární závslost je v podmíněném ranktovém grafu důkazem normalty testovaného rozdělení výběru. Z grafu normálního rozdělení je patrná výrazně menší lokální varablta ve srovnání s ranktovým grafy. Pravděpodobnostní graf (P-P graf), (osa x: P,osay: F(S T ()). Pravděpodobnostní grafy jsou alternatvou ke Q-Q grafům. Slouží k porovnání dstrbuční funkce výběru, vyjádřené přes pořadovou pravděpodobnost, se standardzovanou dstrbuční funkcí zvoleného teoretckého rozdělení. Standardzovaná proměnná je zde defnována vztahem S () (x () Q)/R, kde Q je parametr polohy a R je parametr rozptýlení. Vpřípadě shody výběrového rozdělení se zvoleným teoretckým rozdělením vyjde P-P graf lneární s jednotkovou směrncí anulovým úsekem.

10 Obr..17 Pravděpodobnostní graf (P-P graf) pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Na rozdíl odq-q grafů je př konstrukc P-P grafů nezbytné znát teoretcké rozdělení až do hodnot všech parametrů. Obyčejně se určují odhady parametrů Q a R anavíc dalších parametrů rozdělení svyužtím momentové, resp. metody maxmální věrohodnost. Např. pro normální rozdělení je ˆR =s, ˆQ = x.př porovnání Q-Q a P-P grafů platí, že a) P-P grafy jsou ctlvé na odchylky od teoretckého rozdělení ve střední část, b) Q-Q grafy jsou ctlvé na odchylky od teoretckého rozdělení v oblast konců. Kruhový graf slouží k vzuálnímu ověření hypotézy, že výběr pochází ze symetrckého (nejčastěj Gaussova) rozdělení. V takovém případě je grafem regulární, konvexní polygon, blízký kružnc. Odchylky od kružnce ukazují na jné než symetrcké rozdělení výběru: (a) protáhlý elpsovtý tvar s hlavní osou, umístěnou úhlopříčně ukazuje na asymetrcké rozdělení, (b) elpsovtý tvar podél x-ové osy ukazuje na rovnoměrné rozdělení. Obr..18 Kruhový graf pro výběry: (a) norm, symetrckého (Gaussova, normálního) a (b) log, asymetrckého (logartmcko-normálního) rozdělení, ADSTAT Vychází sezfaktu,že transformací Z () F e (x () ) vyjdou náhodné velčny Z() rozdělené přblžně rovnoměrně na ntervalu [0, 1]. Př konstrukc kruhového grafu se defnuje soustava vektorů V o stejné délce l 0 1/ N (N 1)/ a směru π Z (). Pro x-ovou a y-ovou složku vektoru V platí V x l 0 cos(π Z () ), V y l 0 sn(π Z (). Úhly se uvažují vradánech. Vlastní kruhový graf pak vznkne, když se postupně (od počátku) spojují vektory ) V 1, V,... V N, - V 1, - V,..., - V N. Výsledný obrazec je N vrcholový konvexní polygon. Odchylky od deálního tvaru ukazují na nevhodnost specfkace F, resp. jeho parametrů. e Obyčejně se jako Fe volí dstrbuční funkce normálního rozdělení Φ(x ()) a kruhový graf pak slouží pro ověřování normalty. Exploratorní analýza dat u výběru norm (ADSTAT)

11 (1) Lnearta kvantl-kvantlového (Q-Q) grafu y=β 0 + β1 x: Rozdělení Směrnce β1 Úsek β0 Korelační koefcent rxy Laplaceovo Normální Exponencální Rovnoměrné Lognormální Gumbelovo () Kvantlové míry polohy a rozptýlení: Kvantl L P Spodní LD Horní LH Rozpětí RL Medán M Kvartl F Oktl E Sedecl D (3) Vybrané míry polohy, rozptýlení a tvaru rozdělení, vyčíslené z kvantlů: Kvantl L P Polosuma ZL Škmost SL Délka konců TL Pseudos. Kvartl F Oktl E Sedecl D Korelační koefcent rxy dosahuje nejvyšší hodnoty pro normální rozdělení, atím dokazuje, že výběr norm pochází ze souboru s normálnímrozdělením.. Ověření předpokladů o datech V prax se nejčastěj předpokládá, že data tvoří náhodný výběr {x}, = 1,..., n, velkost n. Reprezentatvní náhodný výběr je charakterzován třem důležtým předpoklady, které je třeba před vlastní analýzou vždy ověřt. Jsou to nezávslost jednotlvých prvků, homogenta a případná normalta rozdělení prvků výběru. 1. předpoklad: Prvky výběru x jsou vzájemně nezávslé Pokud se podmínky pro měření dat mění s časem, projeví se tyto vznkem trendu mez prvky výběru, uspořádaným v časovém sledu. K dentfkac časové závslost prvků výběru nebo závslost souvsející spořadím jednotlvých měření, testujesevýznamnost autokorelačního koefcentu prvního řádu ρa podle testovacího von Neumannova krtéra a T je von Neumannův poměr T t n T 1 n 1 T 1 (1 T 1 T ) n 1, kde, 1 n 4 n 1 j1 (x 1 x ) j n (x x) 1. Pokud jsou prvky výběru vzájemně nezávslé a platí nulová hypotéza H 0: ρ a = 0, má velčna tn Studentovo rozdělení s(n+1) stupn volnost. Alternatvní hypotéza je H A: ρa U 0. Platí-l, že propřípad t n > t 1 α/ (n 1) je nutno nulovou hypotézu H0 o nezávslost prvků výběru na hladně významnost α zamítnout.. předpoklad: Výběr je homogenní Homogenní výběr znamená, že všechny jeho prvky x, = 1,..., n, pocházejí ze stejného rozdělení skonstantním rozptylem σ. K nehomogentě naměřených dat dochází všude tam, kde se vyskytuje výrazná nestejnoměrnost měřených vlastností vzorků nebo se náhle mění podmínky expermentů. Specálním případem jsou vybočující měření.

12 Nehomogenta může být způsobena také nevhodnou specfkací souboru. Pokud lze daný výběr rozdělt podle nějakých logckých krtérí do několka podskupn, je možno zpracovat statstcky každou podskupnu zvlášť apak na základě testů shody středních hodnot v podskupnách rozhodnout, zda je toto dělení významné. Omezíme se na případ, kdy se v datech vyskytují vybočující hodnoty. Tyto hodnoty se co do velkost výrazně lší od ostatních a lze je běžně dentfkovat v grafech průzkumové analýzy. Vybočující měření slně zkreslují odhady polohy a zejména rozptylu s,takže zcela znehodnocují další statstckou analýzu. Problém vybočujících měření je velm komplkovaný. Př jejch ověřování se používá řada dealzovaných předpokladů. Jenutné znát jejch předpokládaný počet, jejch rozdělení arozdělení zbývajících prvků výběru. Navíc je třeba sestrojt model, podle kterého se vybočující měření chovají. Testování vybočujících měření bez doplňkových nformací je proto málo spolehlvé. Jednoduchá technka, kdy se pouze předpokládá, že "správná" data mají normální rozdělení, jemodfkace dolní vntřní hradby a horní vntřní hradby, B D B H B D x 0.5 K ( x 0.75 x ) B 0.5, H x 0.75 K ( x 0.75 x ) 0.5 Parametr K se volí tak, abypravděpodobnost P(n, K), že zvýběru velkost n a pocházejícího z normálního rozdělení, nebude žádný prvek mmo vntřní hradby [ B D, B H ], byla dostatečně vysoká, např Přvolbě P(n, K) = 0.95lzevrozmezí 8 n 100 použít aproxmace K /n. Pro takto určený parametr K se všechny prvky výběru, ležící mmo hradby [ B D, B H ] považují za vybočující. Výhodou je robustnost postupu. Není třeba znát počet vybočujících bodů an jejch rozdělení aneprojevují se an různé efekty "maskování". 3. předpoklad: Rozdělení výběru je normální Na předpokladu normalty je založena celá standardní statstcká analýza dat. V testu kombnace výběrové škmost a špčatost dle Jarque-Berra se užívá testovací krtérum χ exp ĝ 1 D(ĝ 1 ) [ĝ E(ĝ )] D(ĝ ) kde jsou výběrováškmost ĝ 1 a její rozptyl D( ĝ 1), resp. výběrová špčatost ĝ ĝ ĝ, její střední hodnota E( ) arozptyl D( ). Zapředpokladu normalty má velčna χ exp asymptotcky χ ()-rozdělení. Prokáže-l se proto, že χ exp > χ1α(), je nutno hypotézu o normaltě rozdělení výběru zamítnout. Střední hodnota výběru, pocházejícího z normálního rozdělení je E(ĝ 1 ) 0. Pro asymptotcký rozptyl tohoto odhadu platí Momentový odhad špčatost g je D(ĝ 1 ). ĝ (n ) (n 1)(n 3) n j n 1 E(ĝ ) 3 (x x) 4 j n (x x) 1 Střední hodnota tohoto odhadu pro výběry pocházející z normálního rozdělení je a pro asymptotcký rozptyl tohoto odhadu platí 6 n 1 4 n (n ) (n 3) D(ĝ ).. (n 1) (n 3) (n 5) Př stanovení lbovolného bodového odhadu parametru je třeba určt vždy jeho rozptyl. K docílení stejné "přesnost" odhadů je třeba přužtí méně efektvního odhadu provést větší počet měření n. Například u dat pocházejících znormálního rozdělení se musí přpoužtí medánu x 0.5 provést 1.6krát více měření než přpoužtí artmetckého průměru x, aby se docíllo stejné přesnost odhadu.

13 Základní předpoklady o prvcích výběru norm (ADSTAT) (a) Odhady klasckých parametrů: Odhad artmetckého průměru x : Odhad rozptylu s : 5.3E-03 Odhad směrodatné odchylky s: Odhad škmost ĝ 1 : Odhad špčatost ĝ : 3.08 (b)testnormalty:tabulkový kvantl χ (): α Odhad χ exp statstky: 0.11 Závěr: Předpoklad normalty přjat na spočtené hladně významnost α = (c)testnezávslost: tabulkový kvantl t (n+1): Odhad von Neumannovy statstky t n: 1.18 Závěr: Předpoklad nezávslost přjat na spočtené hladně významnost α = (d) Detekce odlehlých bodů: metodou modfkované vntřní hradby Dolní vntřní hradba B D: Horní vntřní hradba B H: Závěr: Ve výběru nejsou odlehlé body..3 Transformace dat 1-α/ Pokud se na základě analýzy dat zjstí, že rozdělení výběru dat se systematcky odlšuje od rozdělení normálního, vznká problém, jak data vůbec vyhodnott. Často je pak vhodná transformace dat, která vede ke stablzac rozptylu, zesymetrčtění rozdělení aněkdy k normaltě rozdělení. 1. Stablzace rozptylu vyžaduje nalezení transformace y = g(x), vekteré je jž rozptyl σ (y) konstantní. Pokud je rozptyl původní proměnné x funkcí typu σ (x) = f(x), lze rozptyl σ (y) určt σ (y). y g(x) dg(x) dx g(x). C m dx f 1 (x) C kde C je konstanta. Hledaná transformace g(x) je pak řešením dferencální rovnce f 1 (x) x λ λ >0 ln x pro λ 0 x λ λ <0 Hnesův - Hnesové selekční graf (osa x: x 0.5/ x 1-P, osa y: x P / x 0.5). Dagnostckou pomůckou pro odhad optmálního exponentu λ je selekční graf dle Hnese a Hnesové. Vychází zpožadavků symetre jednotlvých kvantlů kolem medánu x P x 0.5 λ 1. Zesymetrčtění rozdělení výběru je možné provést užtím jednoduché (prosté) mocnnné transformace. Mocnnná transformace však nezachovává měřítko, není vzhledem k hodnotě λvšude spojtá a hodí se pouze pro kladná data. Optmální odhad exponentu λ se hledá s ohledem na optmalzac charakterstk asymetre (škmost) a špčatost. K určení optmálního λ lze užít ranktového grafu, kdy pro optmální exponent λ budou kvantly y () ležet na přímce nebo selekčního grafu dle Hnese a Hnesové. x 0.5 x 1P λ, kde jako kvantly jsou obvykle voleny písmenové hodnoty. K porovnání průběhu jednotlvých bodů sdeálnímpro λ -λ zvolené λ se do grafu zakreslují řešení rovnce y + x =pro0 x 1a0 y 1:

14 a) pro λ =0jeřešenímpřímka y = x, -λ 1/λ b) pro λ <0jeřešením vztah y =(-x ), λ -1/λ c) pro λ >0jeřešením vztah x =(-y ). Podle umístění expermentálních bodů v okolí nomogramu teoretckých křvek selekčního grafu lze vzuálně odhadovat velkost λ a posuzovat tak kvaltu transformace v různých vzdálenostech od medánu. Obr..19 (a) Hnesův-Hnesové selekční graf a (b) graf logartmu věrohodnostní funkce na λ pro výběr z lognormálního rozdělení, ADSTAT Pro přblížení rozdělení výběru k rozdělení normálnímu vzhledem k škmost a špčatost se užívá Boxovy-Coxovy transformace y g(x) x λ 1 λ (λ U 0) ln x (λ 0) Boxova-Coxova transformace je použtelná pouze pro kladná data. Rozšíření této transformace na oblast, kdy rozdělení dat začíná od prahové hodnoty x,spočívá v náhradě x rozdílem (x -x), který je vždy kladný. 0 0 Graf logartmu věrohodnostní funkce (osa x: λ, osay: lnl). Pro odhad parametru λ v Boxově-Coxově transformac lze užít metodu maxmální věrohodnost s tím, že pro λ = ˆλ je rozdělení transformované velčny y normální, N(µ y, σ (y)). Po úpravách bude logartmus věrohodnostní funkce ve tvaru ndkuje odhad ˆλ. lnl(λ) n lns (y) (λ 1) j n kde s(y)je výběrový rozptyl transformovaných dat y. Průběhvěrohodnostní funkce ln L(λ) lze znázornt ve zvoleném ntervalu např.-3 λ 3 a dentfkovat maxmum křvky, jehož x-ová souřadnce Dva průsečíky křvky ln L(λ) s rovnoběžkou s x-ovouosoundkují 100(1-α)%ní nterval spolehlvost parametru λ. Čím bude tento nterval spolehlvost +λ D, λ H, šrší, tím je mocnnná Boxova-Coxova transformace méně výhodná. Pokud obsahuje nterval +λ D, λ H, hodnotuλ = 1, není transformace ze statstckého hledska přínosem. Zpětná transformace: po vhodné transformac vyčíslíme ȳ, s (y) a potom pomocí zpětné transformace s využtím Taylorova rozvoje v okolí ȳ odhadneme retransformované parametry x R a s ( x R ) původních dat. Uvedený postup vesměsvedeklepšímodhadům polohy x R a rozptylu s ( x R )ajevhodný zvláště vpřípadech asymetrckého rozdělení výběru. Mocnnná a Box-Coxova transformace u výběru norm a úlohy B.04 (ADSTAT) (1) Odhady klasckých parametrů: norm B.04 Odhad artmetckého průměru Odhad směrodatné odhylky Odhad škmost Odhad špčatost () Prostá mocnnná transformace: Odhad optmálního exponentu lnx

15 Odhad průměru transformovaných dat Odhad směrodatné odchylky transformovaných dat Odhad škmost transformovaných dat Odhad špčatost transformovaných dat Opravený odhad průměru původních dat Opravený odhad směrodatné odchylky původních dat Spodní mez ntervalu spolehlvost původních dat Horní mez mez ntervalu spolehlvost původních dat (3) Box-Coxova transformace: Odhad optmálního exponentu Odhad průměru transformovaných dat Odhad směrodatné odchylky transformovaných dat Odhad škmost transformovaných dat Odhad špčatost transformovaných dat Opravený odhad průměru původních dat Opravený odhad směrodatné odchylky původních dat Spodní mez ntervalu spolehlvost původních dat Horní mez mez ntervalu spolehlvost původních dat Průběhprůzkumové analýzy dat Průběh vlastní průzkumové, exploratorní analýzy dat (EDA) je možné lbovolně kombnovat dle dosavadních nformací o vyšetřovaných datech. Omezíme se na zpracování dvojího druhu dat, rutnních dat, o kterých jsou známy vlastnost jako je např. rozdělení ajednakneznámých dat, okterých nejsou známy dosud žádné předběžné nformace a hrozí nebezpečí nesplnění předpokladů o datech. A. Postup analýzy rutnních dat Př zpracování rutnních výsledků měření předpokládáme, že známe rozdělení dat. Předpokládá se, že rozdělení dat je normální a data as splňují předpoklady nezávslost a homogenty. Účelem je a) testování nezávslost prvků výběru - autokorelace, b) testování homogenty výběru, c) testování normalty rozdělení výběru. Z grafckých metod se k předběžné analýze rutnních dat nejčastěj užívá ranktového grafu a grafu rozptýlení s kvantly.nejsou-l však o rozdělení dat dostupné žádné nformace nebo očekává-l se výrazně nenormální rozdělení, je vhodné provést a) průzkumovou analýzu dat s využtím řady grafckých dagnostk, b) určení výběrového rozdělení a jeho konstrukce. Pokud nebylo nalezeno vhodné aproxmující rozdělení, provádí se mocnnná transformace, která by měla zlepšt rozdělení dat. Kombnace metod závsí na konkrétních datech a konkrétních požadavcích analýzy. B. Postup př nesplnění předpokladů o datech 1. Nesplnění předpokladu nezávslost prvků: Pokud prvky měření nejsou nezávslé, vzrůstá nebezpečí, že odhady budou systematcky vychýleny a nadhodnoceny pro poztvní hodnotu autokorelačního koefcentu ρ. a Nezbývá, než hlouběj analyzovat logcké příčny a snažt se o jejch odstranění, zkontrolovat celý měřcí řetězec aprovést nová měření.. Nesplnění předpokladu normalty výběru: Rozdělení dat je buď jné než normální, nebo jsou v datech vybočující měření. V případě nenormálního rozdělení dat může jít o odchylky pouze v délce konců, nebo se jedná oseškmená rozdělení. V případě symetrckých rozdělení, lšících se od normálního délkou konců lze použít pro odhad parametrů polohy a rozptýlení jednoduché robustní technky. U seškmených rozdělení je vždy výhodné začít hledáním mocnnné transformace. Pokud byla mocnnná transformace úspěšná a byla nalezena optmální mocnna λ,provádí se další analýza v této transformac a nakonec se vyčíslí zpětná transformace do původních proměnných. Pro seškmená rozdělení, charakterzovaná třetím centrálním momentem m,lze defnovat modfkovanou 3 náhodnou velčnu

16 T C ( x µ) ˆm 3 m 3 6 σ n m 3 3 ( x n σ 4 µ) s která má Studentovo rozdělení s(n -1)stupnvolnost.Př praktckých výpočtech se rozptyl σ nevychýleným odhadem s atřetí centrální moment m jeho nevychýleným odhadem Př konstrukc konfdenčního ntervalu střední hodnoty 3 n j n (n 1) (n ) 1 (x x ) 3 L D µ L H nahrazuje se užívá vztahů pro dolní a horní meze L D x 1 C d 1, L C H x 1 C d C kde C 1 ˆm 3 6 s n C ˆm 3 3 s 4 C t 1 α/ (n1) s n d C (C 1 C) d 1 4 C (C 1 C) S využtím tohoto konfdenčního ntervalu pro střední hodnotu seškmených rozdělení lze také provádět testy významnost parametru polohy. 3. Přítomnost vybočujících hodnot: Nazákladě logcké analýzy je třeba nejdříve zvážt, zda nejde o seškmené rozdělení. Body,které se jeví vybočující pro symetrcké (specálně normální) rozdělení, mohou být pro seškmená rozdělení naopak přjatelné. Pokud jde o vybočující pozorování, lze použít dvou alternatv. První alternatva spočívá v jejch vyloučení z další analýzy, což však není vždy zcela nejvhodnější. Pokud jsou vybočující měření výsledkem řídce se vyskytujících jevů, může tímtotž dojít keztrátě nformace úplně. Protolze tyto hodnoty vyloučt jedně př doplnění o nová expermentální data. Druhá alternatva spočívá v použtí robustních metod. Tento postup však nemusí být vždy korektní. Robustnost spočívá vpřblížení se k přjatému modelu měření bez ohledu na jeho platnost. Pokud se analýzy vybočujících měření účastní expermentátor, mělbyrozhodnout, která měření jsou evdentní hrubé chyby (jako je selhání přístroje, špatný záps dat), a která jsou jen podezřelá. Evdentní hrubé chyby je vhodné z další analýzy vyloučt, ale podezřelá měření je lépe ponechat. Robustním metodam se jejch vlv na odhady parametrů výrazně oslabí. 4. Nedostatečný rozsah výběru: Nejjednodušší je v tomto případě provést dodatečná měření. Platí, že čím jsou data méně rozptýlená, tím menší počet jch stačí k zajštění dostatečné přesnost odhadu. Pokud nelze provést dodatečné expermenty, je možné použít technky vhodné pro malé výběry (vz Hornůvpostupve3.kap.). Tento postup je vhodný zejména pro analýzu rutnních měření, kde jsou o chování dat předběžné nformace. Když se analyzují výsledky nových měření nebo neznámé výběry, je vždy třeba začít průzkumovou analýzou dat a stanovt statstcké zvláštnost výběru.

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

Kvantily a písmenové hodnoty E E E E-02

Kvantily a písmenové hodnoty E E E E-02 Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,

Více

Nejlepší odhady polohy a rozptýlení chemických dat

Nejlepší odhady polohy a rozptýlení chemických dat Nejlepší odhady polohy a rozptýlení chemických dat Prof. RNDr. Milan Meloun, DrSc., Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice email: milan.meloun@upce.cz, http://meloun.upce.cz

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

Statistická analýza. jednorozměrných dat

Statistická analýza. jednorozměrných dat Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova 6 461 17 Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Statistická šetření a zpracování dat.

Statistická šetření a zpracování dat. Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i : ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

4.4 Exploratorní analýza struktury objektů (EDA)

4.4 Exploratorní analýza struktury objektů (EDA) 4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

Porovnání dvou reaktorů

Porovnání dvou reaktorů Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ

Více

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT V OSTRAVĚ 20.3.2006 MAREK MOČKOŘ PŘÍKLAD Č.1 : ANALÝZA VELKÝCH VÝBĚRŮ Zadání: Pro kontrolu

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Metody matematické statistiky (NMAI 061)

Metody matematické statistiky (NMAI 061) Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné

Více

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

Staré mapy TEMAP - elearning

Staré mapy TEMAP - elearning Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Exploratorní analýza dat

Exploratorní analýza dat 2. kapitola Exploratorní analýza dat Řešení praktických úloh z Kompendia, str. 81. Načtení dat po F3. Načtená data úlohy B201 je možné v editoru ještě opravovat. Volba statistické metody v červeném menu.

Více

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj. Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometre Specální případy použtí MNČ Cvčení 8 Zuzana Dlouhá Specální případy použtí MNČ cvčení 1 7 = ekonometrcký model, který byl lneární v proměnných v parametrech MNČ můžeme použít,

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

A[a 1 ; a 2 ; a 3 ] souřadnice bodu A v kartézské soustavě souřadnic O xyz

A[a 1 ; a 2 ; a 3 ] souřadnice bodu A v kartézské soustavě souřadnic O xyz 1/15 ANALYTICKÁ GEOMETRIE Základní pojmy: Soustava souřadnic v rovině a prostoru Vzdálenost bodů, střed úsečky Vektory, operace s vektory, velikost vektoru, skalární součin Rovnice přímky Geometrie v rovině

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

IDENTIFIKACE BIMODALITY V DATECH

IDENTIFIKACE BIMODALITY V DATECH IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti

Více

Postup statistického zpracování výsledků stopové analýzy při použití transformace dat

Postup statistického zpracování výsledků stopové analýzy při použití transformace dat Postup statistického zpracování výsledků stopové analýzy při použití transformace dat Milan Meloun Katedra analytické chemie, Univerzita Pardubice, 53 10 Pardubice milan.meloun@upce.cz a Jiří Militký Katedra

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2 Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných

Více

Modul Základní statistika

Modul Základní statistika Modul Základní statistika Menu: QCExpert Základní statistika Základní statistika slouží k předběžné analýze a diagnostice dat, testování předpokladů (vlastností dat), jejichž splnění je nutné pro použití

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometre Specální případy použtí MNČ Cvčení 9 Zuzana Dlouhá Specální případy použtí MNČ cvčení 1 8 = ekonometrcký model, který byl lneární v proměnných v parametrech MNČ můžeme použít,

Více

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má Tepelná kapacta C x = C V = ( ) dq ( ) du Dulong-Pettovo pravdlo: U = 3kT N C V = 3kN x V = T ( ) ds x Tepelná kapacta mřížky Osclátor s kvantovanou energí E n = ( n + 2) hν má střední hodnotu energe (po

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)

Více

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ 5. Odborná konference doktorského studa s meznárodní účastí Brno 003 POUŽITÍ METODY PERT PŘI ŘÍZEÍ PROJEKTŮ A USAGE OF PERT METHOD I PROJECT MAAGEMET Vladslav Grycz 1 Abstract PERT Method and Graph theory

Více

MATEMATIKA II - vybrané úlohy ze zkoušek v letech

MATEMATIKA II - vybrané úlohy ze zkoušek v letech MATEMATIKA II - vybrané úlohy ze zkoušek v letech 2009 2012 doplněné o další úlohy 3. část KŘIVKOVÉ INTEGRÁLY, GREENOVA VĚTA, POTENIÁLNÍ POLE, PLOŠNÉ INTEGRÁLY, GAUSSOVA OSTROGRADSKÉHO VĚTA 7. 4. 2013

Více

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Licenční studium Galileo: Statistické zpracování dat Analýza velkých výběrů Hornův postup analýzy malých výběrů Statistické testování Statistická analýza jednorozměrných dat Semestrální práce Lenka Husáková

Více

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Přednáška č. 11 Analýza rozptylu při dvojném třídění Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

POTENCIÁL ELEKTRICKÉHO POLE ELEKTRICKÉ NAPĚTÍ

POTENCIÁL ELEKTRICKÉHO POLE ELEKTRICKÉ NAPĚTÍ POTENCIÁL ELEKTRICKÉHO POLE ELEKTRICKÉ NAPĚTÍ ELEKTRICKÝ POTENCIÁL Elektrcká potencální energe Newtonův zákon pro gravtační sílu mm F = G r 1 2 2 Coulombův zákon pro elektrostatckou sílu QQ F = k r 1 2

Více

FYZIKA I. Pohybová rovnice. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art.

FYZIKA I. Pohybová rovnice. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art. VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ FYZIKA I Pohybová rovnce Prof. RNDr. Vlém Mádr, CSc. Prof. Ing. Lbor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art. Dagmar Mádrová

Více

MATEMATIKA II - vybrané úlohy ze zkoušek ( 2015)

MATEMATIKA II - vybrané úlohy ze zkoušek ( 2015) MATEMATIKA II - vybrané úlohy ze zkoušek ( 2015 doplněné o další úlohy 13. 4. 2015 Nalezené nesrovnalosti ve výsledcích nebo připomínky k tomuto souboru sdělte laskavě F. Mrázovi ( e-mail: Frantisek.Mraz@fs.cvut.cz.

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více