- PDF Stažení zdarma

Transkript

1 LISP-STAT: PROST REDI PRO STATISTICKE V YPOCTY A GRAFIKU Ivan K RIV Y OU PrF, KM Abstrat: Basi instrutions of XLISP-STAT (an implementation of the Lisp-Stat environment for statistial omputing and dynami graphis) are briey desribed. The XLISP-STAT environment is found to be modern (objet{oriented), exible (open and extensible) and easily attainable for everybody. An example is given to illustrate the possibilities of using the XLISP-STAT in exploratory data analysis. Rezme: V rabote izloeny osnovnye instrukii sistemy XLISP-STAT (implementaii sredy Lisp-Stat dl statistiqeskih vyqisleni i dinamiqesko grafiki). Pokazano, qto ta sreda predstavlet obekto{orientirovannoe, otkrytoe (sposobnoe rasxireni) i legko dostupnoe sredstvo dl razvedoqnogo analiza dannyh. Vozmonosti primeneni XLISP-STAT illstrirovany na primere iz oblasti lineno regressii. 1 Uvod S rozvojem vypoetn tehniky se prirozene zvysuj naroky na statistiky software, jeho ryhlost a kvalitu, vypovda shopnost zskanyh vysledku a uzivatelsky komfort. Usil odbornku smeruje k navrzen statistikeho vypoetnho prostred, ktere vyuzva interaktivnho programovaho jazyka vysoke urovne respektuje prinipy objektove orientovaneho programovan pri reprezentai datovyh struktur a statistikyh modelu poskytuje prostredky pro grake programovan (dynamike grafy) umoznuje zpraovavat i nestandardn statistika data V podstate existuj dva odlisne prstupy k vytvoren takoveho prostred: 1. vytvoren noveho speializovaneho statistikeho jazyka (S-PLUS) 2. adaptae jiz existujho modernho jazyka pro statistike vypoty Lisp-Stat [5] predstavuje vysledek druheho z uvedenyh prstupu, vyhazejho z jazyku Lisp. Zahrnuje v sobe interaktivn jazyk Lisp, funke pro zakladn statistike vypoty, objektove orientovany system na podporu grakeho programovan, prostredky pro konstruki grafu a interfae na Windows. Poskytuje i radu dalsh vyhod:

2 bezplatna distribue software moznost denovat nove funke, objekty a jejih metody velmi dobra a prubezne doplnovana dokumentae Zatm prevlada implementae XLISP-STAT zalozena na dialektu XLISP, jez prauje jako aplikae pod Windows (MS 3.1 Windows pro DOS na IBM PC nebo X-Windows pro UNIX na praovnh stanih Sun). Existuje take implementae XLISP-STAT pro personaln potae MaIntosh. 2 Charakteristika Lispu Veskera interake s prostredm Lisp-Stat se deje prostrednitvm konverzae mezi uzivatelem a interpretem Lispu. Uzivatel zadava vyrazy, interpret je vyhodnouje a vra jejih hodnoty. Slozitejs vyrazy se zapisuj v tzv. pre- xove notai,tj.ve tvaru (< operator > < operand ; 1 >... < operand ; n>) Tyto vyrazy se zpravidla vyhodnouj jakoaplikae funke < operator > na argumenty < operand ; 1 >,..., < operand ; n>. Data jsou v Lispu dvojho typu: jednoduha aslozena. Za jednoduha data se povazuj: sla (ela, realna, komplexn) logike konstanty (t a nil) znaky (napr. #na) reteze (napr. "ab...z") symboly Symboly jsou realna fyzika data ulozena v pameti. Dany symbol muze reprezentovat jak promennou, tak i funki. Zakladnm nastrojem pro konstruki slozenyh dat jsou seznamy (lists) a funkn aparat na jejih vytvaren a zpraovan. Prestoze maj sekvenn strukturu, mohou byt pouzity i k reprezentai neusporadanyh souboru polozek (napr. mnozin). Pro konstruki seznamu se pouzva vyrazu (konstruk): (list < item ; 1 >... <item; n>) (quote (< item ; 1 >... < item ; n>)) '(< item; 1 >... < item ; n>) Polozkou seznamu muze byt libovolny datovy objekt, tedy i seznam. Polozky seznamu se sluj zasadne od nuly. K reprezentai numerikyh dat je mozno pouzt i datovyh typu vetor a array.

3 Promennym (Lispu) se prirazuj hodnoty pomo vyrazu (def < name > < value >) Napr. zapis (def x (list )) denuje promennou x jako seznam tvoreny tyrmi uvedenymi numerikymi polozkami. Zakladn opera pri programovan v Lispu je denie funke. Takova denie ma tvar (defun < name > < parameters > < body >) v nemz < name > zna jmeno funke, < parameters > seznam jejih formalnh parametru (argumentu) a < body > jeden nebo ve vyrazu. Napr. funke pro vypoet soutu tveru hodnot promenne x, jez reprezentuje jednoduhy seznam, se denuje takto: (defun sum-of-squares (x) (sum (* x x))) Vetsina funk ma pevny poet argumentu, nektere z nih vsak mohou byt volitelne. Vprpade volitelnyh argumentu lze zadat i " default\ hodnoty. V Lispu existuje ela rada vestavenyh funk a speialnh forem pro: zajisten numerikyh vypotu, napr. funke +, -, *, /, log, exp, sqrt vyhodnoen logikyhvyrazu, napr. predikaty < = >a formy and, or, not konstruki a zpraovan seznamu, napr. funke list, append, member, length rzen vstupu a vystupu, napr. funke print, format Lisp jako jazyk vysoke urovne prirozene disponuje prostredky umoznujmi: vyhodnoovat podmnene vyrazy, napr. pomo if, ond programovat ykly, napr. pomo dotimes, do denovat nejen globaln, ale i lokaln promenne a funke, napr. pomo let vyuzvat knihoven funk denovanyh v ruznyh souboreh (moduleh)

4 3 Vypoty v prostred Lisp-Stat Prostred Lisp-Stat nabz uzivateli veskere prostredky, kterymi disponuje Lisp. 3.1 Cten dat V prpade maleho rozsahu dat lze promennym priradit hodnotu pomo funke list nebo speialn formy quote. Rozsahla data jsou zpravidla ulozena v nejakem souboru. Jsou-li usporadana ve slouph, postupuje se takto: 1. Cely soubor se nate a uloz, napr. do promenne mydata, pomo (def mydata (read-data-olumns "mydata.txt" <k>)) kde <k>zna poet datovyh sloupu. Pokud nen hodnota <k>uvedena, system ji nastav podle potu polozek na prvnm radku. Promenna mydata reprezentuje seznam tvoreny k dlmi seznamy. 2. Jednotlivym promennym se prirad hodnoty pomo funke selet (def x1 (selet mydata 0))... (def xk (selet mydata <k; 1 >)) Pokud nejsou data ve vstupnm souboru usporadana ve slouph, pouzije se funke read-data-le, tedy (def mydata (read-data-le "mydata.txt")) Vtomto prpade promenna mydata predstavuje jednoduhy seznam (nateny poradh). 3.2 Systematika data Takova data se generuj pomo funk iseq, rseq a repeat. Vyraz (iseq <n><m>) generuje seznam po sobe jdouh elyh sel od <n>do <m>. Analogiky vyraz (rseq <a><b><n>)

5 vytvar seznam <n>ekvidistantnh realnyh sel v intervalu od <a> do <b>(vetne obou krajnh hodnot). Volan funke repeat ma obene tvar (repeat < list > < pattern >) kde < list > je seznam a < pattern > kladne ele slo nebo seznam takovyh sel (stejne delky jako < list >). Tato funke generuje data, jejihz polozky se systematiky opakuj. Napr. (repeat (list 1 2 3) 2) ) ( ) (repeat (list 1 2 3) (list 3 2 1)) ) ( ) Uvedena funke je zvlaste vhodna ke kodovan urovn sledovanyh faktoru v analyze rozptylu. 3.3 Pseudonahodna sla Pro generovan pseudonahodnyh sel v Lisp-Statu slouz vyrazy typu (< distribution >-rand < N > < parameters >) ktere generuj seznamy <N>pseudonahodnyh sel z nasledujh rozdelen < distribution > (s prslusnymi parametry): uniform, normal, auhy, gamma, beta, t, hisq, f, bivnorm binomial, poisson Uzivatel ma prirozene moznost menit nasadu (seed) generatoru. Napr. vyraz (normal-rand 50) generuje 50 pseudonahodnyh sel z rozdelen N(0 1). Pokud uzivatel potrebuje pseudonahodna sla z rozdelen napr. N(3 4), mus pouzt vyrazu (+ 3 (* 2 (normal-rand 50))) Nahodny vyber z daneho seznamu se realizuje pomo funke sample. Napr. vyraz (sample (iseq 1 20) 10) vytvar nahodny vyber o rozsahu 10 bez vraen ze seznamu ( ). V prpade, ze se vyzaduje vyber s vraenm, je nutno nav speikovat hodnotu tretho (volitelneho) argumentu, tedy (sample (iseq 1 20) 10 t).

6 3.4 Distribun funke Zakladn modul Lisp-Statu nabz uzivateli prostredky pro vypoet hodnot distribun funke, hustoty (pravdepodobnostn funke) a kvantilu pro tytez typy rozdelen jako v predhazejm odstavi. Jde o funke: Napr. < distribution >-df distribun funke < distribution >-dens hustota pravdepodobnosti < distribution >-pmf pravdepodobnostn funke < distribution >-quant kvantily (hisq-quant.975 3) vra hodnotu 97,5-proentnho kvantilu rozdelen 2 se tremi stupni volnosti. 3.5 Operae se seznamy V prostred Lisp-Stat jsou nektere funke upraveny tak, ze podporuji tzv. vektorizovanou aritmetiku, proto napr. (+ (list 1 23)4)) (5 67) Lisp-Stat poskytuje speialn funke pro prai s matiemi (napr. olumnlist, row-list, diagonal, print-matrix, matmult, determinant, inverse) a funki solve pro resen soustavy linearnh algebraikyh rovni. Zakladn modul Lisp-Statu obsahuje radu funk pro upravu dat ve forme seznamu. Tyto funke umoznuj: vytvaret podmnoziny dat a vyrazovat nektere udaje (selet a remove) spojovat a rozpojovat data (napr. ombine a split-list) menit hodnoty vybranyh polozek (setf) trdit data (sort-data, rank a order) provadet interpolai a vyhlazovan (napr. spline) Zpusob pouzit tehto funk je zrejmy z nasledujh jednoduhyh prkladu. Neht' jsou promenne x a y denovany takto: (def x (list )) (def y(list ))

7 Pak (selet x 3) ) 9 (selet x (whih (< 3 x))) ) ( ) (remove 3x) ) ( ) (ombine x y) ) ( ) (split-list x 3) ) ((3 7 5)(9 12 3)) (rozpojuje vyhozi seznam na seznamy stejne delky) (setf (selet x 4) 10) ) 10 (vybira paty prvek seznamu a meni jeho hodnotu na 10) (sort-data x) ) ( ) (rank x) ) ( ) (vrai seznam poradi prvku ve vyhozim seznamu) (order x) ) ( ) (vrai seznam indexu nejmensiho, druheho nejmensiho,..., nejvetsiho prvku ve vyhozim seznamu) 3.6 Statistike funke Pro elementarn statistike vypoty jsou k dispozii funke: min, max, sum, produt, mean, standard-deviation, median, interquantilerange, umsum, dierene, pmin a pmax. Zpusobpouzitvetsinyz nih je zrejmy. Napr. (umsum '( )) ) ( ) (dierene '( ) ) (2 3 4) (pmin '( ) '( )) ) ( ) (pmax '( ) '( )) ) ( ) 3.7 Poznamky k interpretu Interpret Lisp-Statu poskytuje uzivateli rozsrene sluzby, jez zahrnuj: zaznam konverzae s interpretem (funke dribble) prstup ke trem poslednm natenym vyrazum, resp. jejih hodnotam (vyrazy +, ++, +++, resp. *, **, ***) ushovu hodnot promennyh a jejih zpetne naten (funke savevar a load) informae o funkh, datovyh typeh a nekteryh promennyh (funke help a apropos)

8 4 Grake prostredky v Lisp-Statu Souast Lisp-Statu je objektove orientovany system navrzeny speialne pro podporu interaktivn statistike prae. Objekt predstavuje zvlastn datovou strukturu, ktera obsahuje speike informae o tomto objektu (atributy objektu) a nav je shopna na pozadan (zaslan zpravy) provadet urite ake (metody). Zprava se objektu zasla pomo funke send ve tvaru (send < objet > < seletor > < arg ; 1 >... <arg; n>) v nemz < seletor > je klovy symbol identikuj danou zpravu a <arg; 1 >,...,<arg; n>prslusne argumenty zpravy. Lisp-Stat zahrnuje radu preddenovanyh prototypu objektu. Tyto prototypy pak slouz ke konstruki jednotlivyh instan s konkretnm obsahem (objektu). Uzivatel ma samozrejme k dispozii programove prostredky pro denovan novyh (vlastnh) prototypu a jejih metod, jakoz i pro generovan instan od vseh denovanyh prototypu. Prototypy objektu v Lisp-Statu vytvarej hierarhikou strukturu, ve ktere se respektuje prinip dedinosti. Nejvyse v teto hierarhii stoj prototyp objektu, na nejz ukazuje hodnota globaln promenne *objet*. 4.1 Jednoduhe grafy Zakladn prostredky pro konstruki jednoduhyh grafu poskytuje prototyp graph-proto. Takove grafy tedy predstavuj instane vytvorene od prototypu graph-proto. Slozitejs grafy (napr. histogramy, bodove grafy) se odvozuj od prototypu, ktere jsou ve srovnan s prototypem graph-proto speializovanejs (maj bohats obsah). Pro grakou reprezentai jednorozmernyh dat (ulozenyh vpromenne x) slouz funke histogram a boxplot. Vyrazy (histogram x) a (boxplot x) generuj prslusne grafy a umist'uj je do noveho grakeho okna na monitoru. Dvourozmerna data (ulozena v promennyh x a y) lze zobrazit funkemi plot-points a plot-lines. (plot-points x y) (plot-lines x y) generuje bodovy graf (graf rozptylenosti) generuje graf, jehoz body jsou spojenyusekami Je-li denovana funke f jedne promenne x, potom jej graf v intervalu <xl, xu> se generuje vyrazem (plot-funtion #'f xl xu)

9 Napr. (plot-funtion #'sin (- pi) pi) zobrazuje graf funke sin vintervalu < ; >. 4.2 Dynamika graka Pri studiu vztahu mezi tremi a ve promennymi jsou dosud uvedene prostredky nedostauj. Pro tento uel jsou k dispozii funke satterplotmatrix a spin-plot. Pomo vyrazu (satterplot-matrix (list x... z)) vytvorme matii, jejmiz prvky jsou bodove grafy pro jednotlive pary spei- kovanyh promennyh. Vsehny bodove grafy v matii jsou navzajem propojeny, oz znamena, ze vyzname-li jeden nebo ve bodu v jednom grafu, automatiky se vyzna tyto body i ve vseh ostatnh grafeh. Vyraz (spin-plot (list x y z)) generuje trojrozmerny bodovy graf s moznost rotae kolem vseh tr os. Graf funke f dvou promennyh x a y na mnozine <xl, xu> <yl, yu> vznikne zadanm vyrazu (spin-funtion #'f xl xu yl yu) Takovym grafum (instanm prototypu satmat-proto, resp. spin-proto) se rka dynamike grafy. Vsehny grafy je mozno opatrit nadpisem i popisem jednotlivyh os, a to prirazenm vhodnyh hodnot volitelnym klovym argumentum :title a :variable-labels. Napr. (plot-points x y :title "Mygraph" :variable-labels (list "varx" "vary")) 4.3 Mehanismus poslan zprav Vytvorene grake objekty lze dotvaret i zasadne menit mehanismem poslan zprav. V takovem prpade se nejprve objekt pojmenuje (napr. pomo funke def) a teprve pak se vyzaduje proveden potrebnyh ak. U grakyh objektu vytvorenyh podle vseh standardnh prototypu (vetne prototypu graph-proto) je mozno zaslanm prslusnyh zprav: urit poet promennyh, resp. experimentalnh bodu (zpravy :numvariables, resp.:num-points)

10 pridat nove experimentaln body (:add-points) zadat nebo zmenit pro kazdy bod jeho symbol, barvu a nazev (:pointsymbol, :point-olor, :point-label) zadat nebo zmenit souradnie libovolneho bodu (:point-oordinate) zobrazit osy souradni, upravit poet znaek na osah zmenit rozsah zobrazovan jednotlivyh promennyh (:x-axis, :y-axis, :range) aplikovat linearn transformae (:sale, :enter, :transformation, :rotate-2) zobrazit krivky ve forme lomenyh ar spojujh zadane body(:addlines) Objekty odvozene od speializovanejsh prototypu mohou ovsem reagovat na ve zprav nez objekty vytvorene podle prototypu graph-proto. Che-li uzivatel zskat seznam vsehzprav, kterym dany objekt rozum, posle tomuto objektu zpravu s klovym slovem :help, tedy napr. (send g :help) Je-li uvazovany objekt g odvozen napr. od prototypu satterplot-proto, vyda interpret seznam ve nez 50 standardnhzprav, mezi nimiz jeizprava :abline pro zakreslen prmky do bodoveho grafu. Podrobne informae o teto zprave (poet a typ argumentu, default hodnoty volitelnyh argumentu) se zskaj zaslanm zpravy :help s klovym argumentem :abline, tj. (send g :help :abline) Pak jiz muze uzivatel pouzt zmnenou zpravu ve tvaru (send g :abline <a><b>) kde <a>, <b>jsou hodnoty parametru ve smerniovem vyjadren rovnie prmky (y = a + bx). Vsehny grafy odvozeneod tehoz prototypu znaj stejne metody, seznamy metod pro objekty vytvorene podle ruznyh prototypu se ovsem lis. 4.4 Pohyblive obrazky Zvlastnm typem dynamikyh grafu jsou tzv. pohyblive obrazky (movie). Jde o grake objekty, ktere sevprubehuasu systematiky men (dynamika simulae). Uved'me jednoduhy prklad (viz [5]). Pomo vyrazu (def h (histogram (normal-rand 20)))

11 vygenerujeme histogram pro vyber 20 pseudonahodnyhsel s rozdelenm N(0 1). Nasledne zadan vyrazu (dotimes (i 50) (send h :lear :draw nil) (pause 10) (send h :add-points (normal-rand 20))) zpusob, ze se v grakem okne postupne objevuje 50 histogramu, z nihz kazdy odpovda nejakemu vyberu 20 pseudonahodnyh sel s rozdelenm N(0 1). Vysvetlen. dotimes je speialn forma pro konstruki yklu. Uvedeny yklus je tvoren tremi vyrazy. Zprava :lear sklovym argumentem :draw majm hodnotu nil vymaze data, ale nekresl. Zprava :add-points pridava nova data a zpusob vystup noveho grafu. 5 Regresn analyza v Lisp-Statu 5.1 Linearn regresn modely Linearn regresn model se vytvarpomo funke regression-model. Vyraz (regression-model <x><y>) vnemz <x>je pro jednoduhou regresi seznam hodnot nezavisle promenne a < y > seznam hodnot zavisle promenne, vytvor objekt (ne graky) reprezentuj prslusny model. V prpade venasobne regrese ma prvn argument funke regression-model tvar (list < x; 1 >... < x; n >), tj. reprezentuje seznam seznamu odpovdajh jednotlivym nezavisle promennym. Funke regression-model ma tri klove argumenty: :print :interept :weights s default hodnotou t (tisk vysledku) s default hodnotou t (regresni krivka neprohazi poatkem souradni) s default hodnotou nil (bez pouziti statistikyhvah) Pokud he uzivatel napr. zadat vahy jednotlivym pozorovanm a predpoklada, ze regresn krivka prohaz poatkem, mus zvolit vyraz (regression-model x y:interept nil :weights w) kde w oznauje promennou, v nz jsou ulozeny prslusne vahy. Funke regression-model poskytuje uzivateli souhrn zakladnh udaju o modelu vetne odhadu regresnh parametru a jejih smerodatnyh odhylek, koeientu determinae a vysledku jednoduhe analyzy rozptylu.

12 Vytvoreny regresn model je objektem (instan prototypu regressionproto), a proto s nm (ma-li ovsem nejake jmeno) muze uzivatel komunikovat pomo poslan zprav. Standardn implementae nabz elkem 59 zprav, mimo jine: :oef-estimates :ase-labels :plot-residuals :raw-residuals :residual-sum-of-squares :ooks-distanes :oef-standard-errors :t-values :r-squared :studentized-residuals :leverages :anova Nazvy tehto zprav jsou vesmes samovysvetluj. Poznamka. Ve speialnm modulu w od Cooka a Weisberga [3] se nahazvelmi uzitena funke make-reg pro linearn regresi. K vytvoren prslusneho regresnho objektu slouz vyraz (make-reg :data < var; values > :data-names < var; names > :menu < menu ; name > ) v nemz < var ; values > je seznam seznamu tvorenyh hodnotami jednotlivyh promennyh, < var; names > seznam jmen promennyh a < menu ; name > nazev prslusneho okna s menu. Modul w nen souastzakladn instalae, proto mus byt pred pouzitm nahran z menu hlavnho okna Lisp-Statu. 5.2 Nelinearn regresn modely Jednoduhe nelinearn modely lze zpraovavat pomo funke nreg-model. V tomto prpade uzivatel zadava vyraz ve tvaru (nreg-model <reg; funtion > < y > < initial ; guess >) vnemz < reg;f untion > predstavuje tvar teoretike regresnfunke, < y > seznam hodnot zavisle promenne a < initial ; guess > seznam poatenh hodnot regresnh parametru. Neht' hodnotypromennyh jsou ulozeny v seznameh x, y a teoretika regresn funke ma tvar = 0x 1 + x : Uzivatel nejprve denuje funki vyrazem (def eta (beta) (/ (* (selet beta 0) x) (+ (selet beta 1) x))) Jsou-li poaten odhady parametru 0 =100a 1 =0 1, pak je nutno pro zpraovan uvedeneho modelu zadat

13 (nreg-model #'eta y (list )) Vytvoreny objekt (instane prototypu nreg-proto) rozum vsem zpravam, ktere jsou srozumitelne pro objekty vytvorene pomo funke regressionmodel. Nav je mozno pouzt i dalsh zprav, napr. :ount-limit poet iterai (s default hodnotou 20) :epsilon presnost aproximae (s default hodnotou 0,0001) :new-initial-guess nove poateni odhady parametru :parameter-names jmena regresnih parametru 6 Ilustrativn prklad Moznosti Lisp-Statu ukazeme na jednoduhe uloze linearn regrese se dvema nezavisle promennymi. Vstupn data(viz tab. 1) jsou prevzata z uebnie [1] a doplnena zamerne o udaje v poslednm sloupi (novy bod). Table 1: Vstupn data pro regresi Y x x Data ulozena v souboru "text.dat" se natou instrukemi (def regdata (read-data-olumns "test.dat" 3)) (def x1 (selet regdata 0)) (def x2 (selet regdata 1)) (def y (selet regdata 2)) K prvotnmu posouzen tehto dat poslouz funke satterplot-matrix, tedy (def regsat (satterplot-matrix (list x1 x2 y) :title "Regression data" :variable-labels (list "x1" "x2" "y"))) Podoba vysledne matie bodovyh grafu (viz obr. 1) ukazuje priblizne linearn zavislost promenne y na obou nezavisle promennyh x1 i x2. (Zamerne dodany bod je odlisen tmavym zbarvenm.) Ke stejnemu zaveru vede i analyza grafu generovaneho pomo funke spin-plot.

14 s s 6 y 1 s x 2 15 s 3 7 s s x 1 1 Figure 1: Matie bodovyh grafu pro puvodn data. Linearn regresn model odpovdaj teoretike regresn funki vytvorme zadanm vyrazu = 1 x x 2 (def rm (regression-model (list x1 x2) y :interept nil)) Dostaneme nasleduj sumarn harakteristiku modelu: Least Squares Estimates, Response is Y: Label Estimate Std. Error t-value Variable Variable R Squared: Sigma hat: Number of ases: 8 Degrees of freedom: 6

15 s Figure 2: Diagonaln prvky projekn matie pro puvodn data. Summary Analysis of Variane Table Soure df SS MS F p-value Regression Residual Navrzeny model je na prvy pohled v poradku, oba regresn koeienty jsou na hladine vyznamnosti =0 05 vyznamne odlisne odnuly. Lisp-Stat poskytuje uzivateli pomerne rozsahle prostredky pro regresn diagnostiku. Vedle beznyh nastroju pro analyzu rezidu (obyejnyh rezidu, studentizovanyh rezidu, bayesovskyh rezidu) jsou k dispozii i funke :leverages a :ooks-distanes pro vypoet diagonalnh prvku projekn matie, resp. Cookovy vzdalenosti jednotlivyh bodu. Pouzijme napr. prvn zuvedenyh funk. Vyrazy (def lev (send rm :leverages)) (plot-points x2 lev) generuj graky objekt (viz obr. 2), z nehoz je zrejme, ze dodany bod (oznaeny tmave) se vyrazne odlisuje od vseh ostatnh (ve nez trojnasobnou hodnotou prslusneho diagonalnho prvku projekn matie). Vyrad'me tedy tento bod a proved'me regresnanalyzu znovu. K eliminai uvazovaneho bodu slouz napr. vyrazy

16 Figure 3: Diagonaln prvky projekn matie po vyrazen poslednho udaje. (def x1n (selet x1 (iseq 7))) (def x2n (selet x2 (iseq 7))) (def yn (selet y (iseq 7))) Novy regresn model (v promennyh x1n, x2n a yn), generovany vyrazem (def rmn ((regression-model (list x1n x2n) yn :interept nil)) poskytuje nasleduj informai: Least Squares Estimates, Response is Y: Label Estimate Std. Error t-value Variable Variable R Squared: Sigma hat: Number of ases: 7 Degrees of freedom: 5 Summary Analysis of Variane Table

17 Soure df SS MS F p-value Regression Residual Po vyrazen zamerne pridaneho bodu se situae zmenila. Promenna y (nyn oznaena yn) zavis i nadale vyznamne na vysvetluj promenne x2 (x2n), ale jej zavislost na x1 (x1n) nen prokazatelna( <t 5 (0 05)). Diagonaln prvky nove projekn matie jsou zobrazeny na obr Zaver V prspevku jsou strune popsany zakladn instruke verze XLISP-STAT prostred Lisp-Stat a posouzeny jej moznosti pri analyze dat. Jde o prostred modern (objektove orientovane), exibiln (otevrene a rozsirovatelne) a snadno dostupne pro kazdeho uzivatele. Dosavadn zkusenosti nasveduj tomu, ze je mimoradne vhodne pro pruzkumovou analyzu dat (viz napr. [2]). Snad jedinou nevyhodou je ponekud nezvykly zapis instruk (prexova notae), na nejz si lze ovsem brzy zvyknout. Zakladn modul XLISP-STATu, jehoz tvurem je Luke Tierney [5], je volne k dispozii na adrese V souasnosti jiz existuje ela rada doplnujh modulu, jez jsou take bezplatne distribuovatelne. Nejznamejs je patrne knihovna modulu, kterou udrzuje Jan de Leeuw [4]. Tato knihovna obsahuje mimo jine jiz uvedeny modul w pro regresn analyzu a dale moduly pro analyzu kategorialnh dat, mnohorozmernou statistikou analyzu, metody Monte Carlo, robustn statistiku a analyzu asovyh rad. Uzivatel muze jednotlive moduly zskat na adrese Na tomto mste je vhodne zmnit se o vizualnm statistikem systemu ViSta, navrzenem F. W. Youngem [6] nejen pro profesionaln statistikou prai, ale take pro vyuku statistiky. Zakladn informae o tomto systemu vetne dokumentae a programovyh modulu jsou volne prstupne na adrese

18 Referenes [1] J. Andel: Matematika statistika. Praha, SNTL [2] A. Bartkowiak: Exploratory Data Analysis, its Historial Development, what it is Today. Bioybernetis and Biomedial Engineering, 15, 1-2, 1995, 85 { 120. [3] R. D. Cook, S. Weisberg: An Introdution to Regression Graphis. New York, Wiley [4] J. de Leeuw: The Lisp-Stat Statistial Environment. Statistial Computing & Graphis, 5, 3,1994,13{17. [5] L. Tierney: LISP-STAT.An Objet-Oriented Environment for Statistial Computing and Dynami Graphis. New York, Wiley [6] F. W. Young, R. A. Faldowski, M. M. MFarlane: Multivariate Statistial Visualization. In: C. R. Rao (Editor) Handbook of Statistis, 9, 1993, 959 { 998.