Rozměr: px
Začít zobrazení ze stránky:

Download ""

Transkript

1 LISP-STAT: PROST REDI PRO STATISTICKE V YPOCTY A GRAFIKU Ivan K RIV Y OU PrF, KM Abstrat: Basi instrutions of XLISP-STAT (an implementation of the Lisp-Stat environment for statistial omputing and dynami graphis) are briey desribed. The XLISP-STAT environment is found to be modern (objet{oriented), exible (open and extensible) and easily attainable for everybody. An example is given to illustrate the possibilities of using the XLISP-STAT in exploratory data analysis. Rezme: V rabote izloeny osnovnye instrukii sistemy XLISP-STAT (implementaii sredy Lisp-Stat dl statistiqeskih vyqisleni i dinamiqesko grafiki). Pokazano, qto ta sreda predstavlet obekto{orientirovannoe, otkrytoe (sposobnoe rasxireni) i legko dostupnoe sredstvo dl razvedoqnogo analiza dannyh. Vozmonosti primeneni XLISP-STAT illstrirovany na primere iz oblasti lineno regressii. 1 Uvod S rozvojem vypoetn tehniky se prirozene zvysuj naroky na statistiky software, jeho ryhlost a kvalitu, vypovda shopnost zskanyh vysledku a uzivatelsky komfort. Usil odbornku smeruje k navrzen statistikeho vypoetnho prostred, ktere vyuzva interaktivnho programovaho jazyka vysoke urovne respektuje prinipy objektove orientovaneho programovan pri reprezentai datovyh struktur a statistikyh modelu poskytuje prostredky pro grake programovan (dynamike grafy) umoznuje zpraovavat i nestandardn statistika data V podstate existuj dva odlisne prstupy k vytvoren takoveho prostred: 1. vytvoren noveho speializovaneho statistikeho jazyka (S-PLUS) 2. adaptae jiz existujho modernho jazyka pro statistike vypoty Lisp-Stat [5] predstavuje vysledek druheho z uvedenyh prstupu, vyhazejho z jazyku Lisp. Zahrnuje v sobe interaktivn jazyk Lisp, funke pro zakladn statistike vypoty, objektove orientovany system na podporu grakeho programovan, prostredky pro konstruki grafu a interfae na Windows. Poskytuje i radu dalsh vyhod:

2 bezplatna distribue software moznost denovat nove funke, objekty a jejih metody velmi dobra a prubezne doplnovana dokumentae Zatm prevlada implementae XLISP-STAT zalozena na dialektu XLISP, jez prauje jako aplikae pod Windows (MS 3.1 Windows pro DOS na IBM PC nebo X-Windows pro UNIX na praovnh stanih Sun). Existuje take implementae XLISP-STAT pro personaln potae MaIntosh. 2 Charakteristika Lispu Veskera interake s prostredm Lisp-Stat se deje prostrednitvm konverzae mezi uzivatelem a interpretem Lispu. Uzivatel zadava vyrazy, interpret je vyhodnouje a vra jejih hodnoty. Slozitejs vyrazy se zapisuj v tzv. pre- xove notai,tj.ve tvaru (< operator > < operand ; 1 >... < operand ; n>) Tyto vyrazy se zpravidla vyhodnouj jakoaplikae funke < operator > na argumenty < operand ; 1 >,..., < operand ; n>. Data jsou v Lispu dvojho typu: jednoduha aslozena. Za jednoduha data se povazuj: sla (ela, realna, komplexn) logike konstanty (t a nil) znaky (napr. #na) reteze (napr. "ab...z") symboly Symboly jsou realna fyzika data ulozena v pameti. Dany symbol muze reprezentovat jak promennou, tak i funki. Zakladnm nastrojem pro konstruki slozenyh dat jsou seznamy (lists) a funkn aparat na jejih vytvaren a zpraovan. Prestoze maj sekvenn strukturu, mohou byt pouzity i k reprezentai neusporadanyh souboru polozek (napr. mnozin). Pro konstruki seznamu se pouzva vyrazu (konstruk): (list < item ; 1 >... <item; n>) (quote (< item ; 1 >... < item ; n>)) '(< item; 1 >... < item ; n>) Polozkou seznamu muze byt libovolny datovy objekt, tedy i seznam. Polozky seznamu se sluj zasadne od nuly. K reprezentai numerikyh dat je mozno pouzt i datovyh typu vetor a array.

3 Promennym (Lispu) se prirazuj hodnoty pomo vyrazu (def < name > < value >) Napr. zapis (def x (list )) denuje promennou x jako seznam tvoreny tyrmi uvedenymi numerikymi polozkami. Zakladn opera pri programovan v Lispu je denie funke. Takova denie ma tvar (defun < name > < parameters > < body >) v nemz < name > zna jmeno funke, < parameters > seznam jejih formalnh parametru (argumentu) a < body > jeden nebo ve vyrazu. Napr. funke pro vypoet soutu tveru hodnot promenne x, jez reprezentuje jednoduhy seznam, se denuje takto: (defun sum-of-squares (x) (sum (* x x))) Vetsina funk ma pevny poet argumentu, nektere z nih vsak mohou byt volitelne. Vprpade volitelnyh argumentu lze zadat i " default\ hodnoty. V Lispu existuje ela rada vestavenyh funk a speialnh forem pro: zajisten numerikyh vypotu, napr. funke +, -, *, /, log, exp, sqrt vyhodnoen logikyhvyrazu, napr. predikaty < = >a formy and, or, not konstruki a zpraovan seznamu, napr. funke list, append, member, length rzen vstupu a vystupu, napr. funke print, format Lisp jako jazyk vysoke urovne prirozene disponuje prostredky umoznujmi: vyhodnoovat podmnene vyrazy, napr. pomo if, ond programovat ykly, napr. pomo dotimes, do denovat nejen globaln, ale i lokaln promenne a funke, napr. pomo let vyuzvat knihoven funk denovanyh v ruznyh souboreh (moduleh)

4 3 Vypoty v prostred Lisp-Stat Prostred Lisp-Stat nabz uzivateli veskere prostredky, kterymi disponuje Lisp. 3.1 Cten dat V prpade maleho rozsahu dat lze promennym priradit hodnotu pomo funke list nebo speialn formy quote. Rozsahla data jsou zpravidla ulozena v nejakem souboru. Jsou-li uspo- radana ve slouph, postupuje se takto: 1. Cely soubor se nate a uloz, napr. do promenne mydata, pomo (def mydata (read-data-olumns "mydata.txt" <k>)) kde <k>zna poet datovyh sloupu. Pokud nen hodnota <k>uvedena, system ji nastav podle potu polozek na prvnm radku. Promenna mydata reprezentuje seznam tvoreny k dlmi seznamy. 2. Jednotlivym promennym se prirad hodnoty pomo funke selet (def x1 (selet mydata 0))... (def xk (selet mydata <k; 1 >)) Pokud nejsou data ve vstupnm souboru usporadana ve slouph, pouzije se funke read-data-le, tedy (def mydata (read-data-le "mydata.txt")) Vtomto prpade promenna mydata predstavuje jednoduhy seznam (nateny poradh). 3.2 Systematika data Takova data se generuj pomo funk iseq, rseq a repeat. Vyraz (iseq <n><m>) generuje seznam po sobe jdouh elyh sel od <n>do <m>. Analogiky vyraz (rseq <a><b><n>)

5 vytvar seznam <n>ekvidistantnh realnyh sel v intervalu od <a> do <b>(vetne obou krajnh hodnot). Volan funke repeat ma obene tvar (repeat < list > < pattern >) kde < list > je seznam a < pattern > kladne ele slo nebo seznam takovyh sel (stejne delky jako < list >). Tato funke generuje data, jejihz polozky se systematiky opakuj. Napr. (repeat (list 1 2 3) 2) ) ( ) (repeat (list 1 2 3) (list 3 2 1)) ) ( ) Uvedena funke je zvlaste vhodna ke kodovan urovn sledovanyh faktoru v analyze rozptylu. 3.3 Pseudonahodna sla Pro generovan pseudonahodnyh sel v Lisp-Statu slouz vyrazy typu (< distribution >-rand < N > < parameters >) ktere generuj seznamy <N>pseudonahodnyh sel z nasledujh rozdelen < distribution > (s prslusnymi parametry): uniform, normal, auhy, gamma, beta, t, hisq, f, bivnorm binomial, poisson Uzivatel ma prirozene moznost menit nasadu (seed) generatoru. Napr. vyraz (normal-rand 50) generuje 50 pseudonahodnyh sel z rozdelen N(0 1). Pokud uzivatel potrebuje pseudonahodna sla z rozdelen napr. N(3 4), mus pouzt vyrazu (+ 3 (* 2 (normal-rand 50))) Nahodny vyber z daneho seznamu se realizuje pomo funke sample. Napr. vyraz (sample (iseq 1 20) 10) vytvar nahodny vyber o rozsahu 10 bez vraen ze seznamu ( ). V prpade, ze se vyzaduje vyber s vraenm, je nutno nav speikovat hodnotu tretho (volitelneho) argumentu, tedy (sample (iseq 1 20) 10 t).

6 3.4 Distribun funke Zakladn modul Lisp-Statu nabz uzivateli prostredky pro vypoet hodnot distribun funke, hustoty (pravdepodobnostn funke) a kvantilu pro tytez typy rozdelen jako v predhazejm odstavi. Jde o funke: Napr. < distribution >-df distribun funke < distribution >-dens hustota pravdepodobnosti < distribution >-pmf pravdepodobnostn funke < distribution >-quant kvantily (hisq-quant.975 3) vra hodnotu 97,5-proentnho kvantilu rozdelen 2 se tremi stupni volnosti. 3.5 Operae se seznamy V prostred Lisp-Stat jsou nektere funke upraveny tak, ze podporuji tzv. vektorizovanou aritmetiku, proto napr. (+ (list 1 23)4)) (5 67) Lisp-Stat poskytuje speialn funke pro prai s matiemi (napr. olumnlist, row-list, diagonal, print-matrix, matmult, determinant, inverse) a funki solve pro resen soustavy linearnh algebraikyh rovni. Zakladn modul Lisp-Statu obsahuje radu funk pro upravu dat ve forme seznamu. Tyto funke umoznuj: vytvaret podmnoziny dat a vyrazovat nektere udaje (selet a remove) spojovat a rozpojovat data (napr. ombine a split-list) menit hodnoty vybranyh polozek (setf) trdit data (sort-data, rank a order) provadet interpolai a vyhlazovan (napr. spline) Zpusob pouzit tehto funk je zrejmy z nasledujh jednoduhyh prkladu. Neht' jsou promenne x a y denovany takto: (def x (list )) (def y(list ))

7 Pak (selet x 3) ) 9 (selet x (whih (< 3 x))) ) ( ) (remove 3x) ) ( ) (ombine x y) ) ( ) (split-list x 3) ) ((3 7 5)(9 12 3)) (rozpojuje vyhozi seznam na seznamy stejne delky) (setf (selet x 4) 10) ) 10 (vybira paty prvek seznamu a meni jeho hodnotu na 10) (sort-data x) ) ( ) (rank x) ) ( ) (vrai seznam poradi prvku ve vyhozim seznamu) (order x) ) ( ) (vrai seznam indexu nejmensiho, druheho nejmensiho,..., nejvetsiho prvku ve vyhozim seznamu) 3.6 Statistike funke Pro elementarn statistike vypoty jsou k dispozii funke: min, max, sum, produt, mean, standard-deviation, median, interquantilerange, umsum, dierene, pmin a pmax. Zpusobpouzitvetsinyz nih je zrejmy. Napr. (umsum '( )) ) ( ) (dierene '( ) ) (2 3 4) (pmin '( ) '( )) ) ( ) (pmax '( ) '( )) ) ( ) 3.7 Poznamky k interpretu Interpret Lisp-Statu poskytuje uzivateli rozsrene sluzby, jez zahrnuj: zaznam konverzae s interpretem (funke dribble) prstup ke trem poslednm natenym vyrazum, resp. jejih hodnotam (vyrazy +, ++, +++, resp. *, **, ***) ushovu hodnot promennyh a jejih zpetne naten (funke savevar a load) informae o funkh, datovyh typeh a nekteryh promennyh (funke help a apropos)

8 4 Grake prostredky v Lisp-Statu Souast Lisp-Statu je objektove orientovany system navrzeny speialne pro podporu interaktivn statistike prae. Objekt predstavuje zvlastn datovou strukturu, ktera obsahuje speike informae o tomto objektu (atributy objektu) a nav je shopna na pozadan (zaslan zpravy) provadet urite ake (metody). Zprava se objektu zasla pomo funke send ve tvaru (send < objet > < seletor > < arg ; 1 >... <arg; n>) v nemz < seletor > je klovy symbol identikuj danou zpravu a <arg; 1 >,...,<arg; n>prslusne argumenty zpravy. Lisp-Stat zahrnuje radu preddenovanyh prototypu objektu. Tyto prototypy pak slouz ke konstruki jednotlivyh instan s konkretnm obsahem (objektu). Uzivatel ma samozrejme k dispozii programove prostredky pro denovan novyh (vlastnh) prototypu a jejih metod, jakoz i pro generovan instan od vseh denovanyh prototypu. Prototypy objektu v Lisp-Statu vytvarej hierarhikou strukturu, ve ktere se respektuje prinip dedinosti. Nejvyse v teto hierarhii stoj prototyp objektu, na nejz ukazuje hodnota globaln promenne *objet*. 4.1 Jednoduhe grafy Zakladn prostredky pro konstruki jednoduhyh grafu poskytuje prototyp graph-proto. Takove grafy tedy predstavuj instane vytvorene od prototypu graph-proto. Slozitejs grafy (napr. histogramy, bodove grafy) se odvozuj od prototypu, ktere jsou ve srovnan s prototypem graph-proto speializovanejs (maj bohats obsah). Pro grakou reprezentai jednorozmernyh dat (ulozenyh vpromenne x) slouz funke histogram a boxplot. Vyrazy (histogram x) a (boxplot x) generuj prslusne grafy a umist'uj je do noveho grakeho okna na monitoru. Dvourozmerna data (ulozena v promennyh x a y) lze zobrazit funkemi plot-points a plot-lines. (plot-points x y) (plot-lines x y) generuje bodovy graf (graf rozptylenosti) generuje graf, jehoz body jsou spojenyusekami Je-li denovana funke f jedne promenne x, potom jej graf v intervalu <xl, xu> se generuje vyrazem (plot-funtion #'f xl xu)

9 Napr. (plot-funtion #'sin (- pi) pi) zobrazuje graf funke sin vintervalu < ; >. 4.2 Dynamika graka Pri studiu vztahu mezi tremi a ve promennymi jsou dosud uvedene prostredky nedostauj. Pro tento uel jsou k dispozii funke satterplotmatrix a spin-plot. Pomo vyrazu (satterplot-matrix (list x... z)) vytvorme matii, jejmiz prvky jsou bodove grafy pro jednotlive pary spei- kovanyh promennyh. Vsehny bodove grafy v matii jsou navzajem propojeny, oz znamena, ze vyzname-li jeden nebo ve bodu v jednom grafu, automatiky se vyzna tyto body i ve vseh ostatnh grafeh. Vyraz (spin-plot (list x y z)) generuje trojrozmerny bodovy graf s moznost rotae kolem vseh tr os. Graf funke f dvou promennyh x a y na mnozine <xl, xu> <yl, yu> vznikne zadanm vyrazu (spin-funtion #'f xl xu yl yu) Takovym grafum (instanm prototypu satmat-proto, resp. spin-proto) se rka dynamike grafy. Vsehny grafy je mozno opatrit nadpisem i popisem jednotlivyh os, a to prirazenm vhodnyh hodnot volitelnym klovym argumentum :title a :variable-labels. Napr. (plot-points x y :title "Mygraph" :variable-labels (list "varx" "vary")) 4.3 Mehanismus poslan zprav Vytvorene grake objekty lze dotvaret i zasadne menit mehanismem poslan zprav. V takovem prpade se nejprve objekt pojmenuje (napr. pomo funke def) a teprve pak se vyzaduje proveden potrebnyh ak. U grakyh objektu vytvorenyh podle vseh standardnh prototypu (vetne prototypu graph-proto) je mozno zaslanm prslusnyh zprav: urit poet promennyh, resp. experimentalnh bodu (zpravy :numvariables, resp.:num-points)

10 pridat nove experimentaln body (:add-points) zadat nebo zmenit pro kazdy bod jeho symbol, barvu a nazev (:pointsymbol, :point-olor, :point-label) zadat nebo zmenit souradnie libovolneho bodu (:point-oordinate) zobrazit osy souradni, upravit poet znaek na osah zmenit rozsah zobrazovan jednotlivyh promennyh (:x-axis, :y-axis, :range) aplikovat linearn transformae (:sale, :enter, :transformation, :rotate-2) zobrazit krivky ve forme lomenyh ar spojujh zadane body(:addlines) Objekty odvozene od speializovanejsh prototypu mohou ovsem reagovat na ve zprav nez objekty vytvorene podle prototypu graph-proto. Che-li uzivatel zskat seznam vsehzprav, kterym dany objekt rozum, posle tomuto objektu zpravu s klovym slovem :help, tedy napr. (send g :help) Je-li uvazovany objekt g odvozen napr. od prototypu satterplot-proto, vyda interpret seznam ve nez 50 standardnhzprav, mezi nimiz jeizprava :abline pro zakreslen prmky do bodoveho grafu. Podrobne informae o teto zprave (poet a typ argumentu, default hodnoty volitelnyh argumentu) se zskaj zaslanm zpravy :help s klovym argumentem :abline, tj. (send g :help :abline) Pak jiz muze uzivatel pouzt zmnenou zpravu ve tvaru (send g :abline <a><b>) kde <a>, <b>jsou hodnoty parametru ve smerniovem vyjadren rovnie prmky (y = a + bx). Vsehny grafy odvozeneod tehoz prototypu znaj stejne metody, seznamy metod pro objekty vytvorene podle ruznyh prototypu se ovsem lis. 4.4 Pohyblive obrazky Zvlastnm typem dynamikyh grafu jsou tzv. pohyblive obrazky (movie). Jde o grake objekty, ktere sevprubehuasu systematiky men (dynamika simulae). Uved'me jednoduhy prklad (viz [5]). Pomo vyrazu (def h (histogram (normal-rand 20)))

11 vygenerujeme histogram pro vyber 20 pseudonahodnyhsel s rozdelenm N(0 1). Nasledne zadan vyrazu (dotimes (i 50) (send h :lear :draw nil) (pause 10) (send h :add-points (normal-rand 20))) zpusob, ze se v grakem okne postupne objevuje 50 histogramu, z nihz kazdy odpovda nejakemu vyberu 20 pseudonahodnyh sel s rozdelenm N(0 1). Vysvetlen. dotimes je speialn forma pro konstruki yklu. Uvedeny yklus je tvoren tremi vyrazy. Zprava :lear sklovym argumentem :draw majm hodnotu nil vymaze data, ale nekresl. Zprava :add-points pridava nova data a zpusob vystup noveho grafu. 5 Regresn analyza v Lisp-Statu 5.1 Linearn regresn modely Linearn regresn model se vytvarpomo funke regression-model. Vyraz (regression-model <x><y>) vnemz <x>je pro jednoduhou regresi seznam hodnot nezavisle promenne a < y > seznam hodnot zavisle promenne, vytvor objekt (ne graky) reprezentuj prslusny model. V prpade venasobne regrese ma prvn argument funke regression-model tvar (list < x; 1 >... < x; n >), tj. reprezentuje seznam seznamu odpovdajh jednotlivym nezavisle promennym. Funke regression-model ma tri klove argumenty: :print :interept :weights s default hodnotou t (tisk vysledku) s default hodnotou t (regresni krivka neprohazi poatkem souradni) s default hodnotou nil (bez pouziti statistikyhvah) Pokud he uzivatel napr. zadat vahy jednotlivym pozorovanm a predpoklada, ze regresn krivka prohaz poatkem, mus zvolit vyraz (regression-model x y:interept nil :weights w) kde w oznauje promennou, v nz jsou ulozeny prslusne vahy. Funke regression-model poskytuje uzivateli souhrn zakladnh udaju o modelu vetne odhadu regresnh parametru a jejih smerodatnyh odhylek, koeientu determinae a vysledku jednoduhe analyzy rozptylu.

12 Vytvoreny regresn model je objektem (instan prototypu regressionproto), a proto s nm (ma-li ovsem nejake jmeno) muze uzivatel komunikovat pomo poslan zprav. Standardn implementae nabz elkem 59 zprav, mimo jine: :oef-estimates :ase-labels :plot-residuals :raw-residuals :residual-sum-of-squares :ooks-distanes :oef-standard-errors :t-values :r-squared :studentized-residuals :leverages :anova Nazvy tehto zprav jsou vesmes samovysvetluj. Poznamka. Ve speialnm modulu w od Cooka a Weisberga [3] se nahazvelmi uzitena funke make-reg pro linearn regresi. K vytvoren prslusneho regresnho objektu slouz vyraz (make-reg :data < var; values > :data-names < var; names > :menu < menu ; name > ) v nemz < var ; values > je seznam seznamu tvorenyh hodnotami jednotlivyh promennyh, < var; names > seznam jmen promennyh a < menu ; name > nazev prslusneho okna s menu. Modul w nen souastzakladn instalae, proto mus byt pred pouzitm nahran z menu hlavnho okna Lisp-Statu. 5.2 Nelinearn regresn modely Jednoduhe nelinearn modely lze zpraovavat pomo funke nreg-model. V tomto prpade uzivatel zadava vyraz ve tvaru (nreg-model <reg; funtion > < y > < initial ; guess >) vnemz < reg;f untion > predstavuje tvar teoretike regresnfunke, < y > seznam hodnot zavisle promenne a < initial ; guess > seznam poatenh hodnot regresnh parametru. Neht' hodnotypromennyh jsou ulozeny v seznameh x, y a teoretika regresn funke ma tvar = 0x 1 + x : Uzivatel nejprve denuje funki vyrazem (def eta (beta) (/ (* (selet beta 0) x) (+ (selet beta 1) x))) Jsou-li poaten odhady parametru 0 =100a 1 =0 1, pak je nutno pro zpraovan uvedeneho modelu zadat

13 (nreg-model #'eta y (list )) Vytvoreny objekt (instane prototypu nreg-proto) rozum vsem zpravam, ktere jsou srozumitelne pro objekty vytvorene pomo funke regressionmodel. Nav je mozno pouzt i dalsh zprav, napr. :ount-limit poet iterai (s default hodnotou 20) :epsilon presnost aproximae (s default hodnotou 0,0001) :new-initial-guess nove poateni odhady parametru :parameter-names jmena regresnih parametru 6 Ilustrativn prklad Moznosti Lisp-Statu ukazeme na jednoduhe uloze linearn regrese se dvema nezavisle promennymi. Vstupn data(viz tab. 1) jsou prevzata z uebnie [1] a doplnena zamerne o udaje v poslednm sloupi (novy bod). Table 1: Vstupn data pro regresi Y x x Data ulozena v souboru "text.dat" se natou instrukemi (def regdata (read-data-olumns "test.dat" 3)) (def x1 (selet regdata 0)) (def x2 (selet regdata 1)) (def y (selet regdata 2)) K prvotnmu posouzen tehto dat poslouz funke satterplot-matrix, tedy (def regsat (satterplot-matrix (list x1 x2 y) :title "Regression data" :variable-labels (list "x1" "x2" "y"))) Podoba vysledne matie bodovyh grafu (viz obr. 1) ukazuje priblizne line- arn zavislost promenne y na obou nezavisle promennyh x1 i x2. (Zamerne dodany bod je odlisen tmavym zbarvenm.) Ke stejnemu zaveru vede i analyza grafu generovaneho pomo funke spin-plot.

14 s s 6 y 1 s x 2 15 s 3 7 s s x 1 1 Figure 1: Matie bodovyh grafu pro puvodn data. Linearn regresn model odpovdaj teoretike regresn funki vytvorme zadanm vyrazu = 1 x x 2 (def rm (regression-model (list x1 x2) y :interept nil)) Dostaneme nasleduj sumarn harakteristiku modelu: Least Squares Estimates, Response is Y: Label Estimate Std. Error t-value Variable Variable R Squared: Sigma hat: Number of ases: 8 Degrees of freedom: 6

15 s Figure 2: Diagonaln prvky projekn matie pro puvodn data. Summary Analysis of Variane Table Soure df SS MS F p-value Regression Residual Navrzeny model je na prvy pohled v poradku, oba regresn koeienty jsou na hladine vyznamnosti =0 05 vyznamne odlisne odnuly. Lisp-Stat poskytuje uzivateli pomerne rozsahle prostredky pro regresn diagnostiku. Vedle beznyh nastroju pro analyzu rezidu (obyejnyh rezidu, studentizovanyh rezidu, bayesovskyh rezidu) jsou k dispozii i funke :leverages a :ooks-distanes pro vypoet diagonalnh prvku projekn matie, resp. Cookovy vzdalenosti jednotlivyh bodu. Pouzijme napr. prvn zuvedenyh funk. Vyrazy (def lev (send rm :leverages)) (plot-points x2 lev) generuj graky objekt (viz obr. 2), z nehoz je zrejme, ze dodany bod (oznaeny tmave) se vyrazne odlisuje od vseh ostatnh (ve nez trojnasobnou hodnotou prslusneho diagonalnho prvku projekn matie). Vyrad'me tedy tento bod a proved'me regresnanalyzu znovu. K eliminai uvazovaneho bodu slouz napr. vyrazy

16 Figure 3: Diagonaln prvky projekn matie po vyrazen poslednho udaje. (def x1n (selet x1 (iseq 7))) (def x2n (selet x2 (iseq 7))) (def yn (selet y (iseq 7))) Novy regresn model (v promennyh x1n, x2n a yn), generovany vyrazem (def rmn ((regression-model (list x1n x2n) yn :interept nil)) poskytuje nasleduj informai: Least Squares Estimates, Response is Y: Label Estimate Std. Error t-value Variable Variable R Squared: Sigma hat: Number of ases: 7 Degrees of freedom: 5 Summary Analysis of Variane Table

17 Soure df SS MS F p-value Regression Residual Po vyrazen zamerne pridaneho bodu se situae zmenila. Promenna y (nyn oznaena yn) zavis i nadale vyznamne na vysvetluj promenne x2 (x2n), ale jej zavislost na x1 (x1n) nen prokazatelna( <t 5 (0 05)). Diagonaln prvky nove projekn matie jsou zobrazeny na obr Zaver V prspevku jsou strune popsany zakladn instruke verze XLISP-STAT prostred Lisp-Stat a posouzeny jej moznosti pri analyze dat. Jde o prostred modern (objektove orientovane), exibiln (otevrene a rozsirovatelne) a snadno dostupne pro kazdeho uzivatele. Dosavadn zkusenosti nasveduj tomu, ze je mimoradne vhodne pro pruzkumovou analyzu dat (viz napr. [2]). Snad jedinou nevyhodou je ponekud nezvykly zapis instruk (prexova notae), na nejz si lze ovsem brzy zvyknout. Zakladn modul XLISP-STATu, jehoz tvurem je Luke Tierney [5], je volne k dispozii na adrese V souasnosti jiz existuje ela rada doplnujh modulu, jez jsou take bezplatne distribuovatelne. Nejznamejs je patrne knihovna modulu, kterou udrzuje Jan de Leeuw [4]. Tato knihovna obsahuje mimo jine jiz uvedeny modul w pro regresn analyzu a dale moduly pro analyzu kategorialnh dat, mnohorozmernou statistikou analyzu, metody Monte Carlo, robustn statistiku a analyzu asovyh rad. Uzivatel muze jednotlive moduly zskat na adrese Na tomto mste je vhodne zmnit se o vizualnm statistikem systemu ViSta, navrzenem F. W. Youngem [6] nejen pro profesionaln statistikou prai, ale take pro vyuku statistiky. Zakladn informae o tomto systemu vetne dokumentae a programovyh modulu jsou volne prstupne na adrese

18 Referenes [1] J. Andel: Matematika statistika. Praha, SNTL [2] A. Bartkowiak: Exploratory Data Analysis, its Historial Development, what it is Today. Bioybernetis and Biomedial Engineering, 15, 1-2, 1995, 85 { 120. [3] R. D. Cook, S. Weisberg: An Introdution to Regression Graphis. New York, Wiley [4] J. de Leeuw: The Lisp-Stat Statistial Environment. Statistial Computing & Graphis, 5, 3,1994,13{17. [5] L. Tierney: LISP-STAT.An Objet-Oriented Environment for Statistial Computing and Dynami Graphis. New York, Wiley [6] F. W. Young, R. A. Faldowski, M. M. MFarlane: Multivariate Statistial Visualization. In: C. R. Rao (Editor) Handbook of Statistis, 9, 1993, 959 { 998.

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Pokud data zadáme přes Commands okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18. Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

8. Posloupnosti, vektory a matice

8. Posloupnosti, vektory a matice . jsou užitečné matematické nástroje. V Mathcadu je často používáme například k rychlému zápisu velkého počtu vztahů s proměnnými parametry, ke zpracování naměřených hodnot, k výpočtům lineárních soustav

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

EKONOMETRIE 10. přednáška Modely zpožděných proměnných

EKONOMETRIE 10. přednáška Modely zpožděných proměnných EKONOMERIE 10. přednáška Modely zpožděnýh proměnnýh Časové posuny mezi působením určitýh faktorů (vyvolány např. informačními, rozhodovaími, instituionálními a tehnologikými důvody). Setrvačnost ve vývoji

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1. 2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:

Více

Testy nezávislosti kardinálních veličin

Testy nezávislosti kardinálních veličin Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese - základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data

Více

Uni- and multi-dimensional parametric tests for comparison of sample results

Uni- and multi-dimensional parametric tests for comparison of sample results Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistická analýza dat

Statistická analýza dat Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte

Více

Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Karta předmětu prezenční studium

Karta předmětu prezenční studium Karta předmětu prezenční studium Název předmětu: Číslo předmětu: 545-0250 Garantující institut: Garant předmětu: Ekonomická statistika Institut ekonomiky a systémů řízení RNDr. Radmila Sousedíková, Ph.D.

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Optimalizace provozních podmínek. Eva Jarošová

Optimalizace provozních podmínek. Eva Jarošová Optimalizace provozních podmínek Eva Jarošová 1 Obsah 1. Experimenty pro optimalizaci provozních podmínek 2. EVOP klasický postup využití statistického softwaru 3. Centrální složený návrh model odezvové

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

M cvičení : GLM04b (Vztah mezi Poissonovým a

M cvičení : GLM04b (Vztah mezi Poissonovým a RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04b (Vztah mezi Poissonovým a binomických rozdělením) Připomeňme, že pomocí Poissonova rozdělení P o(λ) lze dobře aproximovat binomické rozdělení Bi(n,

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI Aleš Linka 1, Petr Volf 2 1 Katedra textilních materiálů, FT TUL, 2 Katedra aplikované matematiky, FP TUL ABSTRAKT. Internetové

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté polynomy pro případ dvou uzlových bodů ξ 1 = 1 a ξ 2 = 4. Experimentální body jsou x = [0.2 0.4 0.6 1.5 2.0 3.0

Více

05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")

05/29/08 cvic5.r. cv5.dat <- read.csv(cvic5.csv) Zobecněné lineární modely Úloha 5: Vzdělání a zájem o politiku cv5.dat

Více

0.1 Funkce a její vlastnosti

0.1 Funkce a její vlastnosti 0.1 Funkce a její vlastnosti Veličina - pojem, který popisuje kvantitativní (číselné) vlastnosti reálných i abstraktních objektů. Příklady veličin: hmotnost (m) čas (t) výše úrokové sazby v bance (i) cena

Více

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích Nedostatešný popis systému a jeho modelu vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělit fyzickou nebo

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Matematika (KMI/PMATE)

Matematika (KMI/PMATE) Úvod do matematické analýzy Funkce a její vlastnosti Funkce a její vlastnosti Veličina Veličina - pojem, který popisuje kvantitativní (číselné) vlastnosti reálných i abstraktních objektů. Funkce a její

Více

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání 1. Analýzu variance (ANOVu) používáme při studiu problémů, kdy máme závislou proměnou spojitého typu a nezávislé proměnné

Více

Operace s polem příklady

Operace s polem příklady Equation Chapter 1 Setion 1 1 Gradient Operae s polem příklady Zadání: Nadmořská výška libovolného bodu na povrhu kope je dána formulí h(x y) = A exp [ (x/l 0 ) 9(y/l 0 ) ] kde A = 500 m l 0 = 100 m Nalezněte

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní

Více

Uživatelská příručka

Uživatelská příručka OM-Link Uživatelská příručka Verze: 2.1 Prosinec 2006 Copyright 2005, 2006 ORBIT MERRET, s r.o. I Nápověda k programu OM-Link Obsah Část I Úvod 3 Část II Základní pojmy a informace 3 1 Připojení... 3 2

Více

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor

Více

11 Analýza hlavních komponet

11 Analýza hlavních komponet 11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu

Více

Pomůcka pro cvičení: 3. semestr Bc studia

Pomůcka pro cvičení: 3. semestr Bc studia Pomůcka pro cvičení: 3. semestr Bc studia Statistika Základní pojmy balíček: Statistics Pro veškeré výpočty je třeba načíst balíček Statistic. Při řešení můžeme použít proceduru infolevel[statistics]:=1,

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot

Více

Matematika I (KMI/PMATE)

Matematika I (KMI/PMATE) Přednáška první aneb Úvod do matematické analýzy Funkce a její vlastnosti Úvod do matematické analýzy Osnova přednášky pojem funkce definice funkce graf funkce definiční obor funkce obor hodnot funkce

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech. Statistics ToolBox Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech. [manual ST] 1. PROBABILITY DISTRIBUTIONS Statistics

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,

Více

0.1 Úvod do matematické analýzy

0.1 Úvod do matematické analýzy Matematika I (KMI/PMATE) 1 0.1 Úvod do matematické analýzy 0.1.1 Pojem funkce Veličina - pojem, který popisuje kvantitativní (číselné) vlastnosti reálných i abstraktních objektů. Příklady veličin: hmotnost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

M cvičení : GLM03a (The Working Activities of Bees)

M cvičení : GLM03a (The Working Activities of Bees) RNDr. Marie Forbelská, Ph.D. 1 M7222 3. cvičení : GLM03a (The Working Activities of Bees) Popis dat je v souboru bees.txt, samotná data jsou uložena v souboru bees.dat. Nejprve načteme popisný soubor pomocí

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

5 Charakteristika odstředivého čerpadla

5 Charakteristika odstředivého čerpadla 5 Charakteristika odstředivého čerpadla František Hovorka I Základní vztahy a definie K dopravě kapalin se často používá odstředivýh čerpadel Znalost harakteristiky čerpadla umožňuje posouzení hospodárnosti

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

Obsah přednášky. programovacího jazyka. Motivace. Princip denotační sémantiky Sémantické funkce Výrazy Příkazy Vstup a výstup Kontinuace Program

Obsah přednášky. programovacího jazyka. Motivace. Princip denotační sémantiky Sémantické funkce Výrazy Příkazy Vstup a výstup Kontinuace Program Denotační sémantika programovacího jazyka doc. Dr. Ing. Miroslav Beneš katedra informatiky, A-1007 59 732 4213 Obsah přednášky Princip denotační sémantiky Sémantické funkce Výrazy Příkazy Vstup a výstup

Více

Příklad: Součet náhodných čísel ve vektoru s počtem prvků, které zadá uživatel, pomocí sum() a pomocí cyklu for. Ověříme, že příliš výpisů na

Příklad: Součet náhodných čísel ve vektoru s počtem prvků, které zadá uživatel, pomocí sum() a pomocí cyklu for. Ověříme, že příliš výpisů na Příklad: Součet náhodných čísel ve vektoru s počtem prvků, které zadá uživatel, pomocí sum() a pomocí cyklu for. Ověříme, že příliš výpisů na obrazovku zpomaluje tím, že zobrazíme okno (proužek) o stavu

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu

Více

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ SEMESTRÁLNÍ PRÁCE Kalibrace a limity její přesnosti Precheza a.s. Přerov 2005 Ing. Miroslav Štrajt 1. Zadání Úloha 1. Lineární kalibrace: u přímkové

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

MATEMATIKA. O paradoxech spojených s losováním koulí

MATEMATIKA. O paradoxech spojených s losováním koulí MATEMATIKA O paradoxeh spojenýh s losováním koulí PAVEL TLUSTÝ IRENEUSZ KRECH Ekonomiká fakulta JU, České Budějovie Uniwersytet Pedagogizny, Kraków Matematika popisuje a zkoumá různé situae reálného světa.

Více

Kontingenční tabulky v MS Excel 2010

Kontingenční tabulky v MS Excel 2010 Kontingenční tabulky v MS Excel 2010 Autor: RNDr. Milan Myšák e-mail: milan.mysak@konero.cz Obsah 1 Vytvoření KT... 3 1.1 Data pro KT... 3 1.2 Tvorba KT... 3 2 Tvorba KT z dalších zdrojů dat... 5 2.1 Data

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek UNIVERZITA PARDUBICE Licenční Studium Archimedes Statistické zpracování dat a informatika 4.4 Aproximace křivek a vyhlazování křivek Mgr. Jana Kubátová Endokrinologický ústav V Praze, leden 2012 Obsah

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

VY_32_INOVACE_M-Ar 8.,9.20 Lineární funkce graf, definiční obor a obor hodnot funkce

VY_32_INOVACE_M-Ar 8.,9.20 Lineární funkce graf, definiční obor a obor hodnot funkce VY_32_INOVACE_M-Ar 8.,9.20 Lineární funkce graf, definiční obor a obor hodnot funkce Anotace: Prezentace zavádí pojmy lin. funkce, její definiční obor a obor hodnot funkce. Dále vysvětluje typy funkcí

Více

Matematický ústav v Opavě. Studijní text k předmětu. Softwarová podpora matematických metod v ekonomice

Matematický ústav v Opavě. Studijní text k předmětu. Softwarová podpora matematických metod v ekonomice Matematický ústav v Opavě Studijní text k předmětu Softwarová podpora matematických metod v ekonomice Zpracoval: Ing. Josef Vícha Opava 2008 Úvod: V rámci realizace projektu FRVŠ 2008 byl zaveden do výuky

Více

MSA-Analýza systému měření

MSA-Analýza systému měření MSA-Analýza systému měření Josef Bednář Abstrakt: V příspěvku je popsáno provedení analýzy systému měření v technické praxi pro spojitá data. Je zde popsáno provedení R&R studie pomocí analýzy rozptylu

Více

Základy algoritmizace a programování

Základy algoritmizace a programování Základy algoritmizace a programování Práce s maticemi Přednáška 9 23. listopadu 2009 Pole: vektory a matice Vektor (jednorozměrné pole) deklarace statická int v1[5]; dynamická int * v2; + přidělení paměti:

Více