KLASIFIKAČNÍ A REGRESNÍ LESY

Rozměr: px
Začít zobrazení ze stránky:

Download "KLASIFIKAČNÍ A REGRESNÍ LESY"

Transkript

1 ROBUST 2004 c JČMF 2004 KLASIFIKAČNÍ A REGRESNÍ LESY Jan Klaschka, Emil Kotrč Klíčová slova: Klasifikační stromy, klasifikační lesy, bagging, boosting, arcing, Random Forests. Abstrakt: Klasifikační les je klasifikační model vytvořený kombinací určitého počtu klasifikačních stromů. Každý strom přiřazuje hodnotě vektoru prediktorů nějakou třídu a výsledná klasifikační funkce je dána hlasováním. Obdobně regresní les sestává z několika regresních stromů a výsledná regresní funkce je obvykle definována jako vážený průměr regresních funkcí jednotlivých stromů. V práci jsou stručně vysvětleny některé metody vytváření lesů, jmenovitě tzv. bagging, boosting, arcing a Random Forests. 1 Úvod Klasifikační a regresní stromy se pěstují od 60. let. Silným metodologickým impulsem byla v 80. letech kniha[3], popisující tehdy novou metodu CART (Classification And Regression Trees). Věrozvěstem metody CART a stromů obecněnarobustusevr.1988staljaromírantochpříspěvkem[1]. Mezitím, co od druhé poloviny 90. let přibývaly na ROBUSTu další práce ostromech[8],[11],[12],odstartovalavesvětě nejvícealeasivpracovněleo Breimana,jednohoz otců CARTu nováetaparozvojemetodanalýzydat založenýchnastromech.zdáse,žejenačaseprobratjitakénarobustu. Tématem tohoto článku jsou klasifikační a regresní lesy. Klasifikační les je klasifikační model, jehož klasifikační funkce je dána kombinací(podle vhodně zvoleného pravidla) klasifikačních funkcí určitého počtu(typicky několika desítek) klasifikačních stromů. Obdobně lze charakterizovat regresní les stačí vpředcházejícívětěvšudenahraditslovo klasifikační slovem regresní. Dlužno poznamenat, že článek nebude v rámci české literatury takovým pionýrským počinem jako již citovaná práce[1]: Přinejmenším se o některých technikách konstrukce lesů zmiňuje(byť v obecnější poloze) Berka v knize[2]. 2 Klasifikační a regresní stromy Les, jak každé malé dítě ví, se skládá ze stromů. Zopakujme některá základní fakta o stromech(podrobněji viz[3],[1]): Klasifikační strom představuje model pro data, kde každé pozorování patřídoněkteréztříd C 1,..., C k, k 2.Současnějepozorovánícharakterizovánovektoremx = (x 1,..., x m )hodnotvysvětlujícíchproměnných(prediktorů) X 1,..., X m.vjednéatéžeúlozesemohouvyskytovat prediktory kvantitativní i kvalitativní. Model lze popsat stromovým grafem sestávajícím z uzlů a orientovaných hran(orientace se nevyznačuje, hrana vede shora dolů).

2 178 Jan Klaschka, Emil Kotrč Vkaždémneterminálnímuzlusestromvětví zuzluvedouhranydo dvou nebo(v některých metodách) více dceřinných uzlů. Větvení je založeno na hodnotě jediného prediktoru. Nejběžnější je binární větvení podleodpovědinaotázkutvaru x i < c? prokvantitativníprediktory X i a x i B? (kde Bjeneprázdnávlastnípodmnožinamnožiny všechhodnotveličiny X i )proprediktory X i kvalitativní.jednahrana je pak přiřazena kladné a druhá záporné odpovědi.(některé metody umožňují i větvení založená na lineární kombinaci kvantitativních prediktorů.) Pozorovánípodlehodnotprediktorů postupuje odkořenovéhouzlu přes větvení v neterminálních uzlech k některému terminálnímu uzlu (listu). Množina všech listů určuje disjunktní rozklad prostoru hodnot prediktorů X. Terminálnímu uzlu a zároveň pozorováním, která do něj patří,jepřiřazenaněkteráztříd C 1,..., C k.strom Ttakurčujeklasifikačnífunkci d T definovanouna Xshodnotamivmnožině {C 1,...,C k }. Regresní strom se od klasifikačního stromu liší tím, že každému terminálnímu uzlu je přiřazena reálná konstanta odhad kvantitativní závisle proměnné Y.Regresnístrom T definujereálnouregresnífunkci d T,která je uvnitř množin odpovídajících terminálním uzlům konstantní. K vytváření(pěstování) stromů prakticky všechny běžné metody využívají tzv. rekurzivní dělení(recursive partitioning). Konstrukce začíná stromem o jediném uzlu, do kterého patří všechna trénovací data(kořen je zároveň listem). Probere se množina všech možných větvení a pro každé z nich se vypočte kriteriální statistika(splitting criterion), která budiž řečeno bez podrobností hodnotí, nakolik jsou potenciální dceřinné uzly co do hodnot závisle proměnné vnitřně homogenní a navzájem odlišné. Větvení s maximální hodnotoukritériasevyberejakonejlepšíapoužijesevmodelu,kněmužtak přibude dvojice(popř. v některých metodách větší počet) uzlů, jež jsou prozatím terminální. Data, která patří do kořenového uzlu, se rozdělí podle hodnot prediktorů mezi nové dceřinné uzly. Pro každý z těchto provizorních listů se procedura opakuje, jako by se jednalo o kořen hledá se nejlepší větvení, atd. Při konstrukci klasifikačního stromu je žádoucí dosáhnout co nejmenší skutečné(generalizační)klasifikačníchyby R P (T)=P ( d T (X) Y ),kde P jesdruženérozdělenívektoruprediktorůxazávisleproměnné Y shodnotamiv{c 1,..., C k }.Vregresníchúloháchobdobnourolinejčastějihraje (skutečná)středníkvadratickáchyba R P (T)=E P ( Y dt (X) ) 2.Srostoucí velikostí stromu sice stále klesá(nebo alespoň neroste) chyba na trénovacích datech, ale skutečná chyba v mnoha typických situacích klesá jen do určité velikosti, pak s dalším zvětšováním stromu opět roste. Podlepřístupukproblémustanovení správnévelikosti semetodypěstování stromů dělí do dvou skupin. Metody z prvé skupiny přidávají nová větvení, jen dokud to přináší dostatečně velký okamžitý efekt. Když se takové větvení nenajde, proces končí a strom je hotov. Metody druhého typu(např. CART[3])nejdřívevypěstujítzv.velkýstrom T max,kterýsenásledněproře-

3 Klasifikační a regresní lesy 179 zává některéuzlyseopětodstraňují.přikostrukci T max seuzelstaneterminálním, až když obsahuje méně pozorování než zvolená mez nebo všechna pozorování v uzlu patří do téže třídy, popř. mají stejné hodnoty všech prediktorů.otom,jakvelkáčáststromu T max semáodstranit,rozhodujíempirické odhady skutečné chyby. Ty se získávají různými způsoby, například pomocí testovacích(validačních) dat, která byla k tomu účelu při konstrukci stromu ponechánastranou,nebosložitějším trikem,křížovouvalidací (cross-validation), při níž se v opakovaných analýzách všechna pozorování střídají v rolích prvků trénovací a testovací množiny.(detaily viz[3],[1]). Mezi metodami pěstování stromů požívají asi největší prestiže Breimanův, Friedmanův, Olshenův a Stoneův CART(Classification And Regression Trees)([3]) a Quinlanova metoda C4.5([9]). Jediná současná implementace CARTu posvěcená autorymetodyješířenakomerčněfirmousalfordsystems 1 (SanDiego,CA,USA).VolnéprogramytreearpartvrámciprojektuR 2 však představují také dosti věrné implementace metodologie CART. ProgramC4.5jekdispozicibezplatně 3.VylepšenouverzipodnázvyC5.0(Unix) asee5(windows)komerčněšíříquinlanovafirmarulequestresearch 4. Informace o řadě dalších programů konstruujících stromy lze nalézt např. nawebovýchstránkáchyu-shanshihaztchai-wanu 5 (spoluautorametod QUESTaCRUISE). Výhodou klasifikačních a regresních stromů je, že pružně postihují vztahy mezi různými typy veličin, nelineární závislosti, interakce proměnných a závislosti, které mají rozdílnou podobu v různých částech prostoru X. Ve srovnání s klasickými parametrickými metodami dosahují často srovnatelné přesnosti, ale poskytují přitom daleko přehlednější a názornější modely. Nevýhodou stromů je, že jsou obvykle značně nestabilní: Zhusta pro jedna a tatáž data existuje mnoho různých stromů s přibližně stejnou chybou a při malé změně dat nebo vstupních parametrů se může výsledný strom(a příslušná klasifikační nebo regresní funkce) výrazně změnit. 3 Lesy Myšlenka klasifikačních a regresních lesů je vcelku prostá: Co místo jednoho stromu Tvypěstovat Lstromů T 1,..., T L avytvořitznich komisi,kteráse bude o zařazení pozorování do tříd,(popř., půjde-li o regresní úlohu, o predikovanéhodnotězávisleproměnné) usnášet 6?Jinýmislovy, agregovaná Užšívýběrhttp:// přehled 6 Jižjednoujsmeseodvolávalinaznalostimalýchdětí,aitotosidneskdekterédítě dokáže představit, pokud vidělo ve filmu Dvě věže, druhém dílu trilogie Pán prstenů, jak sněm Entů(chodících stromů) rozhoduje o tom, zda jít do války, tj. jak řeší klasifikační úlohu,zdavstupníinformace,kteréjsoukdispozici,patřídotřídy válka,nebo mír.

4 180 Jan Klaschka, Emil Kotrč klasifikační(popř.regresní)funkce d A (x)vzniknevhodnýmzkombinováním klasifikačních(popř.regresních)funkcí d 1 (x),..., d L (x)jednotlivýchstromů. Přirozeným a jednoduchým způsobem kombinace je u regrese aritmetický průměr a u klasifikace většinové hlasování, tj. d A (x)=c i,pokud#{j; d j (x)=c i }= max i=1,...,k #{j; d j(x)=c i }, kde symbol# značí počet prvků.(nejednoznačnost vyplývající ze shody počtu hlasů se řeší např. znáhodněním.) Kombinování klasifikačních funkcí(v regresi to je analogické, rozdíly si lze domyslet) může být také o něco složitější. Při hlasování může váha hlasu každé z L klasifikačních funkcí záviset na chybě stromu na trénovacích datech (pochopitelně přesnější strom má vyšší váhu). Váha hlasu jednotlivého stromu případně nemusí být stejná pro všechny hodnoty vektoru prediktorů x může závisetnapř.takénatom,jakjelistpříslušnéhostromu,dokteréhoxpatří, velký(kolikpozorováníztrénovacíhosouborudonějpatří)a čistý (jak výrazná je převaha nejfrekventovanější třídy). Složitější vážení hlasů je dílem už standardní součástí některých metod konstrukce lesů, ale dílem také ještě předmětem výzkumu(viz např.[15],[13]). 3.1 Čtverozpůsobů,jaknato Dobrá, vypěstovat více stromů, ale kde je vzít? Použijeme-li na jedna a tatáž data opakovaně např. program CART se stejnými vstupními parametry, dostaneme pokaždé tentýž strom. Kombinováním totožných stromů pak nic nového nezískáme. Rozdělit data na L disjunktních částí a každou použít ke konstrukci jednoho stromu se také nezdá být dobrý nápad. Problém přesto má řešení, resp. více řešení. Podívejme se na některá z nich Bagging jeakronym,zkratka bootstrapaggregating.základní citace je Breimanův článek[4]. Ztrénovacíhodatovéhosouboru L={(x 1, y 1 ),...,(x n, y n )}sevytvoří náhodnýmvýběremsvracením Lsouborů L 1,..., L L velikosti n(bootstrapových výběrů), každý z nich se použije k sestrojení jednoho klasifikačního (popř. regresního) stromu a výsledný klasifikační(nebo regresní) les je pak dán většinovým hlasováním se stejnými vahami(resp. aritmetickým průměrem dílčích regresních funkcí). Do bootstrapového výběru jsou některá pozorování z L vybrána opakovaně a některá naopak vůbec. Počet opakování má pro jednotlivé pozorování z Lasymptoticky(pro n )Poissonovorozdělenísestředníhodnotou1. Pravděpodobnost, že pozorování nebude vůbec vybráno, je tedy přibližně e Bootstrapovývýběrjetudížtvořenasi63%pozorovánízL, 37% zůstává mimo. Breimanv[4]uvádíulesůvelikosti L=50(tvořenýchstromyvypěstovanými metodou CART) v několika reálných i umělých klasifikačních úlohách snížení generalizační chyby oproti jednomu stromu o 20-47% a velmi podobná čísla 22-46% udávátaképroúlohyregresní.

5 Klasifikační a regresní lesy Boosting a arcing. Boosting(to boost zesilovat) je původně pojemzteoriestrojovéhoučení([14],[5])avanalýzedatsetakobvykleoznačuje algoritmus AdaBoost(adaptive boosting), navržený v článku[7]. Mějme klasifikační metodu(nemusí se jednat jen o stromy), která vytváří klasifikačnímodel T nazákladětrénovacíchdat(x 1, y 1 ),...,(x n, y n )avektoruw=(w 1,...,w n )vahpřiřazenýchjednotlivýmpozorováním.algoritmus AdaBoostkonstruujeposloupnostrozdílnýchmodelů T 1,..., T L sklasifikačnímifunkcemi d 1 (x),..., d L (x)tak,žesepodlepředcházejícíchvýsledkůpostupněupravujíváhypřípadů.vprvnímkrokusepoužijeváhovývektorw 1 zadanýuživatelem(např.rovnoměrnéváhy)avytvořísemodel T 1.Vdalších krocíchsepakvždykekonstrukcimodelu T i (i=2,..., L)použijeváhový vektorw i získanýtakovouúpravouvektoruw i 1, žeseváhypozorování chybněklasifikovanýchmodelem T i 1 zvýšíasprávněklasifikovanýchsníží. Klasifikačnímetodatakstálevíce soustředípozornost na obtížná pozorování, která vzdorují zařazení do správné třídy. Váha modelu při hlasování závisí na chybě modelu na trénovacích datech.(konkrétněji viz[7],[5],[2].) Algoritmus nazvaný v článku[7] AdaBoost je vlastně určen jen pro klasifikační úlohu se dvěma třídami, ale v článku jsou popsány také modifikace AdaBoost.M1 a AdaBoost.M2 pro úlohy s více třídami a AdaBoost.R pro regresní úlohy s hodnotami závisle proměnné v intervalu[0, 1]. Arcing je další Breimanův akronym(adaptive resampling and combining). Základní prací je článek[5]. Arcing představuje spojení myšlenky baggingu a boostingu. Váhy případů se postupně upravují stejným způsobem jako v AdaBoostu, ale používají se jinak: Místo toho, aby s těmito vahami vstupovala všechna pozorování do analýzy, jsou jako v baggingu vytvářeny výběry s vracením, přičemž váhy(náležitě normované) slouží jako pravděpodobnosti vytažení. Ukazuje se(viz např.[10],[5]), že boosting i arcing u klasifikačních stromů většinou snižují generalizační chybu ještě více než bagging. V některých případech však mohou výsledky být naopak katastrofální zejména tehdy, kdyždatajsou zašuměná aučástitrénovacíchdatjehodnotazávisleproměnné y i jiná,než bysprávněmělabýt.boostingneboarcingpakvede ktomu,žeseučímeopakovatchybyvdatech Metoda RandomForests jeopět dítkem LeoBreimana,jehož článek[6]představujezákladnícitaci.jezaloženananěkolika tricích : Trénovací soubory pro jednotlivé stromy jsou(jako v baggingu) bootstrapové výběry z datového souboru L. Přivolběvětveníprodanýuzelsezmprediktorů X 1,...,X m,které jsoukdispozici,nejdřívenáhodněvybereněkterých m 0,načežsenejlepší větvení hledá již klasicky, ale jen mezi těmi větveními, která jsou založenanavybraných m 0 veličinách. Pěstují se velké stromy(viz sekci 2), které se neprořezávají.

6 182 Jan Klaschka, Emil Kotrč Nejen že náhodný výběr prediktorů výrazně urychluje výpočty, ale experimenty v[6] také dávají zejména v klasifikačních úlohách velmi dobré výsledky mj. srovnání s metodou AdaBoost vyznívá pro Random Forests příznivě.(vregresijeefektméněvýraznýazdáse,žejsouoněcovýhodnější některé modifikace uvedeného postupu.) Zvláště přínosná se metoda ukazuje u problémů, kde existuje velký počet prediktorů, z nichž každý sám o sobě obsahuje jen málo informace o závisle proměnné. Jakvolitparametr m 0?Nejvhodnějšíhodnotazávisínaúlozeauživatel můžeexperimentovat.jednoduchérozumnédoporučeníjepoužít m 0 blízké log 2 m. Uněkterýchproblémůsejakodobré,nebodokoncenejlepšíukazuje m 0 =1. Toznamená,žeseprediktor,kterýsemávuzlupoužítprovětvení,vybírá zcela náhodně! Jinými slovy, na tom, jaké větvení se vybere, v podstatě nezáleží, hlavně že se prostor hodnot prediktorů vůbec nějak rozparceluje hlasování(nebo v případě regrese průměrování) to dá do pořádku. To je mimochodem zcela protichůdné optimalizaci stromů, o níž byly v minulých letech na ROBUSTu dva příspěvky([11],[12]) připomeňme, že větvení se optimalizuje za cenu drastických výpočetních nákladů a s výsledky(co do generalizační chyby) mnohdy ne právě uspokojivými. Vidíme zde jeden podstatný rozdíl mezi baggingem, boostingem a arcingem na jedné straně a metodou Random Forests na straně druhé. Bagging, boosting a arcing jsou nadstavbou nad klasickými metodami(jako CART nebo C4.5) zaměřenými na pěstování co nejpřesnějších stromů. U metody Random Forests na kvalitě jednotlivých stromů tolik nezáleží; cílem není minimalizovat chybu stromů, ale jen celého lesa. 3.2 Proč to funguje Zatím jsme se omezili na popisný přístup říkáme, jak která metoda postupuje, ale ne proč. Stejně tak informujeme, jaké jsou empirické výsledky, ale nevysvětlujeme,jakjemožné,žetotakje.můžesetakzdát,ženovézpůsoby konstrukce lesů se navrhují podle vzoru Myslím, myslím, nevím dál, co bych ještěudělal. Ve skutečnosti se při studiu vlastností lesů neuplatňují jen numerické experimenty, ale také teoretické úvahy, byť částečně heuristického charakteru. Čtenáře v tomto ohledu odkazujeme na dříve citovanou literaturu, ale alespoň něco málo naznačíme. Z metod uvedených v paragrafu 3.1 se jen Random Forests týká specificky stromů a lesů. Bagging, boosting a arcing lze aplikovat nejen na stromy, ale na vcelku libovolnou klasifikační či regresní metodu.(všimněme si, že v názvech článků[4] a[5] se mluví obecně o prediktorech a klasifikátorech, nikoli o stromech.) Platí, vágně řečeno, že agregovaný klasifikační model, jehož klasifikační funkce d A jedánakombinacídílčíchklasifikačníchfunkcí d 1,...,d L pomocí hlasování, je tím přesnější(tj. má tím menší skutečnou chybu), čím přes-

7 Klasifikační a regresní lesy 183 nějšíjsoudílčíklasifikátoryačímjsousifunkce d 1,...,d L vzájemněméně podobné. U regrese s agregací průměrováním je to obdobné. Alchymie přidávánínáhodydokonstrukcemodelusledujecílnajítco nejlepšíkompromis:comožnázvýšitvzájemnounepodobnostfunkcí d i,ale tak, aby přesnost dílčích modelů neutrpěla přespříliš. Skrze lesy se ve výhodu obrací nevýhoda stromů jejich nestabilita, tj. fakt,žemalázměnadatzpravidlavedekvelkézměněstromu Tajehoklasifikační(neboregresní)funkce d T.Kdalšímnestabilnímmetodámpatřítřeba neuronové sítě nebo kroková lineární regrese. Příklady stabilních metod jsou lineární diskriminační analýza nebo metoda k nejbližších sousedů. Nestabilní metody lze pomocí baggingu a obdobných technik výrazně zpřesnit, zatímco u stabilních metod je efekt minimální, popřípadě dokonce záporný. 3.3 Software Repertoár softwaru pro pěstování lesů je zatím skromnější než nabídka programů pro konstrukci stromů. Uveďme několik současných možností. Komerční verze programu CART zahrnuje bagging a arcing. Quinlanovy programy C5.0 a See5(viz sekci 2) obsahují boosting. SoftwarovýsystémWeka 7 zaměřenýnastrojovéučení,vyvinutýnauniversity of Waikato na Novém Zélandu, obsahuje pod názvem j48 implementaci metody C4.5, a dále procedury Bagging a AdaBoostM1, které sedajívkombinacisj48použítkpěstovánílesů.wekajefreeware. BreimanůvvlastnísoftwareRandomForestsjevolněkdispozici 8 azároveň existuje komerční verze šířená firmou Salford Systems. Implementace randomforest v projektu R je freeware. Pokud nějaký program pro konstrukci stromů umožňuje snadné zadávání vstupníchúdajůadávávýstupyvevhodnémtvaru, dotvořit jejnasoftware pro pěstování lesů je programátorsky nenáročné. Do původního programu není třeba zasahovat, takže nevadí, není-li dostupný ve zdrojovém tvaru. 4 Závěr Klasifikační a regresní lesy představují významné zdokonalení metodologií založených na stromech. Za cenu únosného zvýšení výpočetní náročnosti se dosahuje výrazného zpřesnění modelů. Patrně jedinou nevýhodou lesů oproti stromům je to, že se ztrácí pro stromy tak charakteristická přehlednost. Na les tvořený desítkami nebo stovkami stromů nejsme schopni, stejně jako je tomu např. u neuronových sítí, se dívatjinaknežjakona černouskříňku.jinýmislovy,dolesanenívidět

8 184 Jan Klaschka, Emil Kotrč Reference [1] Antoch J. (1988). Klasifikace a regresní stromy. In: ROBUST Sborníkprací5.letníškolyJČSMF,J.Antoch,T.Havránek&J.Jurečková(eds.),Praha,JČSMF,0 6. [2] Berka P.(2003). Dobývání znalostí z databází. Praha: Academia. [3] Breiman L., Friedman J.H., Olshen R.A., Stone C.J.(1984). Classification and regression trees. Belmont CA: Wadsworth. [4] Breiman L.(1996). Bagging predictors. Machine Learning 24, [5] Breiman L.(1998). Arcing classifiers. Annals of Statistics 26, [6] Breiman L.(2001). Random forests. Machine Learning 45, [7] Freund Y., Schapire R.E.(1997). A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer andsystemsciences55, [8] Klaschka J., Antoch J. (1997). Jak rychle pěstovat stromy. In: RO- BUST 1996.Sborníkprací9.letníškolyJČMF,J.Antoch&G.Dohnal(eds.),Praha,JČMF, [9] Quinlan J.R.(1992). C4.5: Programs for machine learning. New York: Morgan Kaufmann. [10] Quinlan J.R.(1996). Bagging, boosting, and C4.5. In: Proceedings of the Thirteenth National Conference on Artificial Intelligence, [11] Savický P., Klaschka J., Antoch J.(2000). Optimální klasifikační stromy. In: ROBUST Sborník prací 11. letní školy JČMF, J. Antoch& G.Dohnal(eds.),Praha,JČMF, [12] Savický P., Klaschka J.(2002). Lesk a bída optimálních stromů. In: RO- BUST Sborník prací 12. zimní školy JČMF, J. Antoch, G. Dohnal &J.Klaschka(eds.),Praha,JČMF, [13] Savický P., Kotrč E.(2004). Experimental study of leaf confidences for random forest. In: COMPSTAT Proceedings in Computational Statistics, J. Antoch(ed.), Heidelberg, Physica Verlag, [14] Schapire R.E.(1990). The strength of weak learnability. Machine Learning5, [15] Schapire R.E., Singer Y. (1999). Improved boosting algorithms using confidence-rated predictions. Machine Learning 37, Poděkování:PrácebylapodporovánagrantyME701MŠMTČRaGAČR 201/02/1456. Adresa: J. Klaschka, E. Kotrč, Ústav informatiky AV ČR, Pod Vodárenskou věží2,18207praha8 {klaschka,kotrc}@cs.cas.cz

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Klasifikační a regresní lesy Pokročilé neparametrické metody Klasifikační a regresní lesy Klasifikační les Klasifikační les je klasifikační model vytvořený

Více

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích

Více

Rozhodovací stromy a lesy

Rozhodovací stromy a lesy Rozhodovací stromy a lesy Klára Komprdová Leden 2012 Příprava a vydání této publikace byly podporovány projektem ESF č. CZ.1.07/2.2.00/07.0318 Víceoborová inovace studia Matematické biologie a státním

Více

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky

Více

Zpracování a vyhodnocování analytických dat

Zpracování a vyhodnocování analytických dat Zpracování a vyhodnocování analytických dat naměřená data Zpracování a statistická analýza dat analytické výsledky Naměř ěřená data jedna hodnota 5,00 mg (bod 1D) navážka, odměřený objem řada dat 15,8;

Více

Marta Vomlelová marta@ktiml.mff.cuni.cz

Marta Vomlelová marta@ktiml.mff.cuni.cz Strojové učení Úvod, lineární regrese Marta Vomlelová marta@ktiml.mff.cuni.cz References [1] P. Berka. Dobývání znalostí z databází. Academia, 2003. [2] T. Hastie, R. Tishirani, and J. Friedman. The Elements

Více

Klasifikační metody pro genetická data: regularizace a robustnost

Klasifikační metody pro genetická data: regularizace a robustnost Odd medicínské informatiky a biostatistiky Ústav informatiky AV ČR, vvi Práce vznikla za finanční podpory Nadačního fondu Neuron na podporu vědy Klasifikační metody pro genetická data Regularizovaná klasifikační

Více

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat Zkouška ISR 2013 přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat 1. Rozdílné principy u induktivního a deduktivního

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení

Více

Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012

Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012 Statistické metody v digitálním zpracování obrazu Jindřich Soukup 3. února 2012 Osnova Úvod (Neparametrické) odhady hustoty pravděpodobnosti Bootstrap Použití logistické regresi při klasifikaci Odhady

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

Unstructured data pre-processing using Snowball language

Unstructured data pre-processing using Snowball language Unstructured data pre-processing using Snowball language Předzpracování nestrukturovaných dat pomocí jazyka Snowball Bc. Pavel Řezníček, doc. Ing. František Dařena, PhD., Ústav informatiky, Provozně ekonomická

Více

Kombinatorická optimalizace

Kombinatorická optimalizace České Vysoké Učení Technické v Praze Fakulta Elektrotechnická Kombinatorická optimalizace Petr Kubašta Dvojrozměrný řezný problém Praha, 2012 1 Zadání Firma zabývající se výrobou dětských hraček řeší problém,

Více

Miroslav Čepek 16.12.2014

Miroslav Čepek 16.12.2014 Vytěžování Dat Přednáška 12 Kombinování modelů Miroslav Čepek Pavel Kordík a Jan Černý (FIT) Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti 16.12.2014

Více

ROBUST 2014 - PROGRAM NEDĚLE ODPOLEDNE oběd 12.00-13.00 oběd bude čekat i na ty, kteří přijedou později registrace 13.00-15.00 G. DOHNAL J.

ROBUST 2014 - PROGRAM NEDĚLE ODPOLEDNE oběd 12.00-13.00 oběd bude čekat i na ty, kteří přijedou později registrace 13.00-15.00 G. DOHNAL J. ROBUST 2014 - PROGRAM NEDĚLE ODPOLEDNE oběd 12.00-13.00 oběd bude čekat i na ty, kteří přijedou později registrace 13.00-15.00 G. DOHNAL J. Antoch 15.00-15.05 5 ROBUST 2014 : Zahájení I. Mizera 15.05-16.05

Více

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Příklady použití metod strojového učení v rozpoznávání tváří Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Stavební bloky systému

Více

Matematická statistika

Matematická statistika Matematická statistika Daniel Husek Gymnázium Rožnov pod Radhoštěm, 8. A8 Dne 12. 12. 2010 v Rožnově pod Radhoštěm Osnova Strana 1) Úvod 3 2) Historie matematické statistiky 4 3) Základní pojmy matematické

Více

Připomeň: Shluková analýza

Připomeň: Shluková analýza Připomeň: Shluková analýza Data Návrh kategorií X Y= 1, 2,..., K resp. i jejich počet K = co je s čím blízké + jak moc Neposkytne pravidlo pro zařazování Připomeň: Klasifikace Data (X,Y) X... prediktory

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 11 1/31 Vytěžování znalostí z dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical

Více

Detekce obličeje v obraze s využitím prostředí MATLAB

Detekce obličeje v obraze s využitím prostředí MATLAB Detekce obličeje v obraze s využitím prostředí MATLAB T. Malach, P. Bambuch, J. Malach EBIS, spol. s r.o. Příspěvek se zabývá detekcí obličeje ve statických obrazových datech. Algoritmus detekce a trénování

Více

Úvod do teorie her. David Bartl, Lenka Ploháková

Úvod do teorie her. David Bartl, Lenka Ploháková Úvod do teorie her David Bartl, Lenka Ploháková Abstrakt Předložený text Úvod do teorie her pokrývá čtyři nejdůležitější, vybrané kapitoly z této oblasti. Nejprve je čtenář seznámen s předmětem studia

Více

Kombinování klasifikátorů Ensamble based systems

Kombinování klasifikátorů Ensamble based systems Kombinování klasifikátorů Ensamble based systems Rozhodování z více hledisek V běžném životě se často snažíme získat názor více expertů, než přijmeme závažné rozhodnutí: Před operací se radíme s více lékaři

Více

D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E

D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E CÍLE LABORATORNÍ ÚLOHY 1. Seznámení se s metodami detekce pohybu z videa. 2. Vyzkoušení si detekce pohybu v obraze kamery ÚKOL

Více

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry. Kapitola Ohodnocené grafy V praktických aplikacích teorie grafů zpravidla graf slouží jako nástroj k popisu nějaké struktury. Jednotlivé prvky této struktury mají často přiřazeny nějaké hodnoty (může jít

Více

5.1 Rozhodovací stromy

5.1 Rozhodovací stromy 5.1 Rozhodovací stromy 5.1.1 Základní algoritmus Způsob reprezentování znalostí v podobě rozhodovacích stromů je dobře znám z řady oblastí. Vzpomeňme jen nejrůznějších klíčů k určování různých živočichů

Více

Umělá inteligence a rozpoznávání

Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních

Více

LESK A BÍDA OPTIMÁLNÍCH STROMŮ

LESK A BÍDA OPTIMÁLNÍCH STROMŮ ROBUST 2002, 256 267 c JČMF 2002 LESK A BÍDA OPTIMÁLNÍCH STROMŮ PETR SAVICKÝ, JAN KLASCHKA Abstract. Optimal classification trees have, by the definition, the smallest error on training data, given the

Více

Odhad cen ojetých vozů pomocí rozhodovacích stromů

Odhad cen ojetých vozů pomocí rozhodovacích stromů Odhad cen ojetých vozů pomocí rozhodovacích stromů Marta Žambochová ABSTRAKT Příspěvek se zabývá srovnáním vybraných algoritmů pro sestrojování rozhodovacích stromů, a to jak regresních, tak klasifikačních.

Více

8. Geometrie vrací úder (sepsal Pavel Klavík)

8. Geometrie vrací úder (sepsal Pavel Klavík) 8. Geometrie vrací úder (sepsal Pavel Klavík) Když s geometrickými problémy pořádně nezametete, ony vám to vrátí! Ale když užzametat,takurčitěnepodkoberecamístosmetákupoužijtepřímku.vtéto přednášce nás

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Rozhodovací stromy Doc. RNDr. Iveta Mrázová, CSc.

Více

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE. Teze diplomové práce

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE. Teze diplomové práce ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE FAKULTA PROVOZNĚ EKONOMICKÁ KATEDRA SYSTÉMOVÉ A OPERAČNÍ ANALÝZY Obor: Veřejná správa a regionální rozvoj Teze diplomové práce Optimalizace tras pro cestovní kanceláře

Více

Informační systémy pro podporu rozhodování

Informační systémy pro podporu rozhodování Informační systémy pro rozhodování Informační systémy pro podporu rozhodování 5 Jan Žižka, Naděžda Chalupová Ústav informatiky PEF Mendelova universita v Brně Asociační pravidla Asociační pravidla (sdružovací

Více

Analýza rozptylu dvojného třídění

Analýza rozptylu dvojného třídění StatSoft Analýza rozptylu dvojného třídění V tomto příspěvku si ukážeme konkrétní práci v softwaru STATISTICA a to sice při detekci vlivu jednotlivých faktorů na chování laboratorních krys v bludišti.

Více

2. RBF neuronové sítě

2. RBF neuronové sítě 2. RBF neuronové sítě Kapitola pojednává o neuronových sítích typu RBF. V kapitole je popsána základní struktura tohoto typu neuronové sítě. Poté následuje definice a charakteristika jednotlivých radiálně

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA INFORMAČNÍCH TECHNOLOGIÍ. Uživatelská příručka k programu FloodFilling Art

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA INFORMAČNÍCH TECHNOLOGIÍ. Uživatelská příručka k programu FloodFilling Art VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA INFORMAČNÍCH TECHNOLOGIÍ Uživatelská příručka k programu FloodFilling Art Autor: Jan Bílek e-mail: xbilek14@stud.fit.vutbr.cz 8. 4. 2009 Obsah 1 Princip vytváření

Více

Klasifikace a rozpoznávání

Klasifikace a rozpoznávání Klasifikace a rozpoznávání Prezentace přednášek Ústav počítačové grafiky a multimédií Téma přednášky Boosting Michal Hradiš UPGM FIT Brno University of Technology Obsah: Co je to boosting? Algoritmus AdaBoost

Více

Optimalizační algoritmy inspirované chováním mravenců

Optimalizační algoritmy inspirované chováním mravenců Optimalizační algoritmy inspirované chováním mravenců Biologická analogie ACO metaheuristic Ant system a jeho modifikace Specifikace problémů Aplikace Motivace NP-hard problémy časová náročnost nalezení

Více

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Optimalizace trasy při revizích elektrospotřebičů

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Optimalizace trasy při revizích elektrospotřebičů VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Hlavní specializace: Ekonometrie a operační výzkum Název diplomové práce Optimalizace trasy při revizích elektrospotřebičů Diplomant: Vedoucí

Více

Neuropočítače. podnět. vnímání (senzory)

Neuropočítače. podnět. vnímání (senzory) Neuropočítače Princip inteligentního systému vnímání (senzory) podnět akce (efektory) poznání plánování usuzování komunikace Typické vlastnosti inteligentního systému: schopnost vnímat podněty z okolního

Více

Ten objekt (veličina), který se může svobodně měnit se nazývá nezávislý.

Ten objekt (veličina), který se může svobodně měnit se nazývá nezávislý. @001 1. Základní pojmy Funkce funkční? Oč jde? Třeba: jak moc se oblečeme, závisí na venkovní teplotě, jak moc se oblečeme, závisí na našem mládí (stáří) jak jsme staří, závisí na čase jak moc zaplatíme

Více

Implementace A* algoritmu na konkrétní problém orientace v prostoru budov

Implementace A* algoritmu na konkrétní problém orientace v prostoru budov Implementace A* algoritmu na konkrétní problém orientace v prostoru budov Popis problému Orientaci ve známém prostředí lze převést na problém nalezení cesty z místa A do místa B. Obecně platí, že robot

Více

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Kapitola 9 Skalární součin Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Definice 9.1 Je-li x = (x 1,..., x n ) T R n 1 reálný

Více

Ant Colony Optimization

Ant Colony Optimization Ant Colony Optimization I am lost! Where is the line?! A Bug s Life, Walt Disney, 1998 ACO je metaheuristika, shrnující poznatky ze studia společenstev různých druhů mravenců. Heuristické algoritmy postavené

Více

(n, m) (n, p) (p, m) (n, m)

(n, m) (n, p) (p, m) (n, m) 48 Vícerozměrná kalibrace Podobně jako jednorozměrná kalibrace i vícerozměrná kalibrace se používá především v analytické chemii Bude vysvětlena na příkladu spektroskopie: cílem je popis závislosti mezi

Více

13. Třídící algoritmy a násobení matic

13. Třídící algoritmy a násobení matic 13. Třídící algoritmy a násobení matic Minulou přednášku jsme probírali QuickSort, jeden z historicky prvních třídících algoritmů, které překonaly kvadratickou složitost aspoň v průměrném případě. Proč

Více

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

NAIL072 ROZPOZNÁVÁNÍ VZORŮ NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační

Více

Využití webových kapacit v cestovním ruchu

Využití webových kapacit v cestovním ruchu Využití webových kapacit v cestovním ruchu CÍL KAPITOLY Cíl 1. Představit základy projektů tvorby webových stránek Cíl 2. Představit řešení pro online ukládání a sdílení souborů Cíl 3. Představit základy

Více

8. Systémy pro dobývání znalostí z databází

8. Systémy pro dobývání znalostí z databází 8. Systémy pro dobývání znalostí z databází Jako v jiných oblastech umělé inteligence, tak i v oblasti strojového učení se první programové systémy objevily v akademické sféře. Obvykle se jednalo o systémy,

Více

Simulované žíhání jako nástroj k hledání optimálního řešení

Simulované žíhání jako nástroj k hledání optimálního řešení Simulované žíhání jako nástroj k hledání optimálního řešení Michael Pokorný Střední škola aplikované kbernetik s.r.o., Hradecká 5, Hradec Králové pokorn.michael@ssakhk.cz Abstrakt Simulované žíhání je

Více

Petr Chvosta. vlevo, bude pravděpodobnost toho, že se tyč na počátku intervalu τ B nachází nad vpravo

Petr Chvosta. vlevo, bude pravděpodobnost toho, že se tyč na počátku intervalu τ B nachází nad vpravo MOLEKULÁRNÍ MOTORY Petr Chvosta. Automobil v krupobití aneb brzděním k pohybu Uvažme automobil stojící na mírném svahu a bombardovaný rovnoměrně ze všech stran obrovskými kroupami. Svah stoupá směrem doprava

Více

Řešení problému vážené splnitelnosti booleovské formule pokročilou iterativní metodou

Řešení problému vážené splnitelnosti booleovské formule pokročilou iterativní metodou Řešení problému vážené splnitelnosti booleovské formule pokročilou iterativní metodou 1 SPECIFIKACE ÚLOHY Cílem této úlohy bylo použít vybranou pokročilou iterativní metodou pro řešení problému vážené

Více

Algoritmus Minimax. Tomáš Kühr. Projektový seminář 1

Algoritmus Minimax. Tomáš Kühr. Projektový seminář 1 Projektový seminář 1 Základní pojmy Tah = přemístění figury hráče na tahu odpovídající pravidlům dané hry. Při tahu může být manipulováno i s figurami soupeře, pokud to odpovídá pravidlům hry (např. odstranění

Více

Databáze pacientů. Petr Novák (Ing, Ph.D.) novakpe@labe.felk.cvut.cz 02.07.2014

Databáze pacientů. Petr Novák (Ing, Ph.D.) novakpe@labe.felk.cvut.cz 02.07.2014 Databáze pacientů Petr Novák (Ing, Ph.D.) novakpe@labe.felk.cvut.cz 02.07.2014 1 Obsah 1 Obsah... 1 2 Úvod... 1 3 Přidání pacienta... 3 4 Vymazání pacienta... 5 5 Výběr pacienta... 5 6 Výběr záznamu dat...

Více

Miroslav Čepek. Fakulta Elektrotechnická, ČVUT. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Miroslav Čepek. Fakulta Elektrotechnická, ČVUT. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Vytěžování Dat Přednáška 12 Kombinování modelů Miroslav Čepek Pavel Kordík a Jan Černý (FIT) Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL)

Více

IB108 Sada 1, Příklad 1 Vypracovali: Tomáš Krajča (255676), Martin Milata (256615)

IB108 Sada 1, Příklad 1 Vypracovali: Tomáš Krajča (255676), Martin Milata (256615) IB108 Sada 1, Příklad 1 ( ) Složitost třídícího algoritmu 1/-Sort je v O n log O (n.71 ). Necht n = j i (velikost pole, které je vstupním parametrem funkce 1/-Sort). Lehce spočítáme, že velikost pole předávaná

Více

Dolování znalostí z rozsáhlých statistických souborů lékařských dat

Dolování znalostí z rozsáhlých statistických souborů lékařských dat Mendelova univerzita v Brně Provozně ekonomická fakulta Dolování znalostí z rozsáhlých statistických souborů lékařských dat Diplomová práce Vedoucí práce: doc. Ing. Jan Žižka, CSc. Brno 2015 Vypracoval:

Více

Klasifikační stromy. Metriku, pro níž je E( C, použijeme jako kořen.

Klasifikační stromy. Metriku, pro níž je E( C, použijeme jako kořen. Příklad použití klasifikačního stromu ve spolehlivosti software metoda plovoucích mezí Jan A. Strouhal Abstrakt: Příspěvek se zabývá příkladem konstrukce klasifikačního stromu pro použití ve spolehlivosti

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Rozhodovací stromy a jejich konstrukce z dat

Rozhodovací stromy a jejich konstrukce z dat Příklad počítačová hra. Můžeme počítač naučit rozlišovat přátelské a přátelské roboty? Rozhodovací stromy a jejich konstruk z dat Učení s učitelem: u některých už víme, jakou mají povahu (klasifika) Neparametrická

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Diskrétní rozdělení Vilém Vychodil KMI/PRAS, Přednáška 6 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 6) Diskrétní rozdělení Pravděpodobnost a

Více

Distribuční funkce je funkcí neklesající, tj. pro všechna

Distribuční funkce je funkcí neklesající, tj. pro všechna Téma: Náhodná veličina, distribuční funkce a její graf, pravděpodobnostní funkce a její graf, funkce hustoty pravděpodobnosti a její graf, výpočet střední hodnoty a rozptylu náhodné veličiny 1 Náhodná

Více

Tento text je stručným shrnutím těch tvrzení Ramseyovy teorie, která zazněla

Tento text je stručným shrnutím těch tvrzení Ramseyovy teorie, která zazněla Ramseyovy věty Martin Mareš Tento text je stručným shrnutím těch tvrzení Ramseyovy teorie, která zazněla na mé letošní přednášce z Kombinatoriky a grafů I Předpokládá, že čtenář se již seznámil se základní

Více

IS SEM - informační systém pro správu a evidenci nemovitého majetku hlavního města Prahy

IS SEM - informační systém pro správu a evidenci nemovitého majetku hlavního města Prahy IS SEM - informační systém pro správu a evidenci nemovitého majetku hlavního města Prahy Martin Diviš, Martin Vimr DELTAX Systems a.s. Jankovcova 1569/2c 170 00 Praha 7 martin.divis@deltax.cz, martin.vimr@deltax.cz

Více

ADAPTIVNÍ ALGORITMUS PRO ODHAD PARAMETRŮ NELINEÁRNÍCH REGRESNÍCH MODELŮ

ADAPTIVNÍ ALGORITMUS PRO ODHAD PARAMETRŮ NELINEÁRNÍCH REGRESNÍCH MODELŮ ADAPTIVNÍ ALGORITMUS PRO ODHAD PARAMETRŮ NELINEÁRNÍCH REGRESNÍCH MODELŮ Josef Tvrdík Katedra informatiky, Přírodovědecká fakulta, Ostravská univerzita, 30. dubna 22, 701 03 Ostrava e-mail: tvrdik@osu.cz

Více

Elegantní algoritmus pro konstrukci sufixových polí

Elegantní algoritmus pro konstrukci sufixových polí Elegantní algoritmus pro konstrukci sufixových polí 22.10.2014 Zadání Obsah Zadání... 3 Definice... 3 Analýza problému... 4 Jednotlivé algoritmy... 4 Algoritmus SA1... 4 Algoritmus SA2... 5 Algoritmus

Více

Úvod do mobilní robotiky AIL028

Úvod do mobilní robotiky AIL028 zbynek.winkler at mff.cuni.cz, md at robotika.cz http://robotika.cz/guide/umor05/cs 5. prosince 2005 1 Mapa světa Exaktní plánování 2 3 Plánování s otáčením (náznak řešení) Mapa světa - příklad Obsah Mapa

Více

2.4.8 Další příklady s grafy funkcí s absolutní hodnotou

2.4.8 Další příklady s grafy funkcí s absolutní hodnotou ..8 Další příklady s grafy funkcí s absolutní hodnotou Předpoklady: 0-07 Pedagogická poznámka: Následující dva příklady je většinou nutné studentům dovysvětlit. Prohlížení vlastních poznámek jim většinou

Více

Regulární matice. Věnujeme dále pozornost zejména čtvercovým maticím.

Regulární matice. Věnujeme dále pozornost zejména čtvercovým maticím. Regulární matice Věnujeme dále pozornost zejména čtvercovým maticím. Věta. Pro každou čtvercovou matici A = (a ij ) řádu n nad tělesem (T, +, ) jsou následující podmínky ekvivalentní: (i) Řádky matice

Více

Členění podle 505 o metrologii

Členění podle 505 o metrologii Členění podle 505 o metrologii Měřidla slouží k určení hodnoty měřené veličiny. Spolu s nezbytnými měřícími zařízeními se podle zákona č.505/1990 Sb. ve znění č.l 19/2000 Sb. člení na : a. etalony, b.

Více

OPTIMÁLNÍ SEGMENTACE DAT

OPTIMÁLNÍ SEGMENTACE DAT ROBUST 2004 c JČMF 2004 OPTIMÁLNÍ SEGMENTACE DAT Petr Novotný Klíčová slova: Výpočetní statistika, po částech spojitá regrese. Abstrakt: Snížení paměťové náročnosti při výpočtu po částech spojitého regresního

Více

Hráč, který je na tahu musí vyložit předem daný počet karet z ruky. Počet karet je určen počtem symbolů

Hráč, který je na tahu musí vyložit předem daný počet karet z ruky. Počet karet je určen počtem symbolů EMANUELLE ORNELLA OLTRE MARE BENÁTŠTÍ OBCHODNÍCI MEZI ORIENTEM A ZÁPADEM HERNÍ MATERIÁL 98 karet zboží sedmi druhů (8x drahokamy, 10x svitky, 12x hedvábí, 14x sůl, 16x keramika, 18x olivy, 20x obilí) 1

Více

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB 62 REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB BEZOUŠKA VLADISLAV Abstrakt: Text se zabývá jednoduchým řešením metody nejmenších čtverců v prostředí Matlab pro obecné víceparametrové aproximační funkce. Celý postup

Více

Rozpoznávání captcha obrázků

Rozpoznávání captcha obrázků Rozpoznávání captcha obrázků Tomáš Pop tomas.pop@seznam.cz www.vanocnibesidka.wz.cz Lukáš Bajer bajeluk@matfyz.cz Idea - cíl Captcha bezpečnostní kód, který se opisuje má zabránit automatizovanému využití

Více

Pořízení licencí statistického SW

Pořízení licencí statistického SW Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ

Více

SPECIFICKÝCH MIKROPROGRAMOVÝCH ARCHITEKTUR

SPECIFICKÝCH MIKROPROGRAMOVÝCH ARCHITEKTUR EVOLUČNÍ NÁVRH A OPTIMALIZACE APLIKAČNĚ SPECIFICKÝCH MIKROPROGRAMOVÝCH ARCHITEKTUR Miloš Minařík DVI4, 2. ročník, prezenční studium Školitel: Lukáš Sekanina Fakulta informačních technologií, Vysoké učení

Více

PRAKTICKÉ KALKULACE 1: PŘÍKLAD (NEJEN O) SUPERMARKETU

PRAKTICKÉ KALKULACE 1: PŘÍKLAD (NEJEN O) SUPERMARKETU PRAKTICKÉ KALKULACE 1: PŘÍKLAD (NEJEN O) SUPERMARKETU Série článků, kterou otevíráme tímto titulem, volně navazuje na předcházející dvojdílný příspěvek Tip na zimní večery: sestavte si nákladovou matici.

Více

Ukážeme si lineární algoritmus, který pro pevné k rozhodne, zda vstupní. stromový rozklad. Poznamenejme, že je-li k součástí vstupu, pak rozhodnout

Ukážeme si lineární algoritmus, který pro pevné k rozhodne, zda vstupní. stromový rozklad. Poznamenejme, že je-li k součástí vstupu, pak rozhodnout Ukážeme si lineární algoritmus, který pro pevné k rozhodne, zda vstupní graf má stromovou šířku nejvýše k, a je-li tomu tak, také vrátí příslušný stromový rozklad. Poznamenejme, že je-li k součástí vstupu,

Více

Lineární diskriminační funkce. Perceptronový algoritmus.

Lineární diskriminační funkce. Perceptronový algoritmus. Lineární. Perceptronový algoritmus. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics P. Pošík c 2012 Artificial Intelligence 1 / 12 Binární klasifikace

Více

Jarníkův algoritmus. Obsah. Popis

Jarníkův algoritmus. Obsah. Popis 1 z 6 28/05/2015 11:44 Jarníkův algoritmus Z Wikipedie, otevřené encyklopedie Jarníkův algoritmus (v zahraničí známý jako Primův algoritmus) je v teorii grafů algoritmus hledající minimální kostru ohodnoceného

Více

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6 UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ FAKULTA APLIKOVANÉ INFORMATIKY GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6 Lubomír Vašek Zlín 2013 Obsah... 3 1. Základní pojmy... 3 2. Princip rastrové reprezentace... 3 2.1 Užívané

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ VÝZKUMNÁ ZPRÁVA STABILITA VYBRANÝCH KONFIGURACÍ KOLEJOVÉHO SVRŠKU

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ VÝZKUMNÁ ZPRÁVA STABILITA VYBRANÝCH KONFIGURACÍ KOLEJOVÉHO SVRŠKU VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ INFRAM a.s., Česká republika VÝZKUMNÁ ZPRÁVA STABILITA VYBRANÝCH KONFIGURACÍ KOLEJOVÉHO SVRŠKU Řešitel Objednatel Ing. Petr Frantík, Ph.D. Ústav stavební

Více

VLIV NEURČITOSTI, NEJASNOSTI, NEJISTOTY A SLOŽITOSTI NA ROZHODOVÁNÍ ORGANIZACÍ

VLIV NEURČITOSTI, NEJASNOSTI, NEJISTOTY A SLOŽITOSTI NA ROZHODOVÁNÍ ORGANIZACÍ VLIV NEURČITOSTI, NEJASNOSTI, NEJISTOTY A SLOŽITOSTI NA ROZHODOVÁNÍ ORGANIZACÍ Tomáš Kořínek Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav systémového inženýrství a informatiky Abstract: The

Více

MQL4 COURSE. By Coders guru www.forex-tsd.com. -5 Smyčky & Rozhodnutí Část 2

MQL4 COURSE. By Coders guru www.forex-tsd.com. -5 Smyčky & Rozhodnutí Část 2 MQL4 COURSE By Coders guru www.forex-tsd.com -5 Smyčky & Rozhodnutí Část 2 Vítejte v šesté lekci mého kurzu MQL 4. Doufám, že se vám předchozí lekce líbily. V předchozí lekci jsme se bavili o smyčkách.

Více

SIMULACE ŠÍŘENÍ NAPĚŤOVÝCH VLN V KRYSTALECH MĚDI A NIKLU

SIMULACE ŠÍŘENÍ NAPĚŤOVÝCH VLN V KRYSTALECH MĚDI A NIKLU SIMULACE ŠÍŘENÍ NAPĚŤOVÝCH VLN V KRYSTALECH MĚDI A NIKLU V. Pelikán, P. Hora, A. Machová Ústav termomechaniky AV ČR Příspěvek vznikl na základě podpory záměru ÚT AV ČR AV0Z20760514. VÝPOČTOVÁ MECHANIKA

Více

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

Smíšené regresní modely a možnosti jejich využití. Karel Drápela Smíšené regresní modely a možnosti jejich využití Karel Drápela Regresní modely Základní úloha regresní analýzy nalezení vhodného modelu studované závislosti vyjádření reálného tvaru závislosti minimalizace

Více

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.

Více

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Václav Matoušek KIV. Umělá inteligence a rozpoznávání.   Václav Matoušek / KIV Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 16. 2. (3h) 2. 3. (4h) 17. 3. (5h) 14. 4. (3h) Úvod, historie a vývoj UI, základní

Více

Mgr. Karel Pazourek. online prostředí, Operační program Praha Adaptabilita, registrační číslo CZ.2.17/3.1.00/31165.

Mgr. Karel Pazourek. online prostředí, Operační program Praha Adaptabilita, registrační číslo CZ.2.17/3.1.00/31165. Mnohočleny z různých stran Mgr. Karel Pazourek Kurz vznikl v rámci projektu Rozvoj systému vzdělávacích příležitostí pro nadané žáky a studenty v přírodních vědách a matematice s využitím online prostředí,

Více

Regulační funkce. v aplikaci pro řízení vzduchotechniky. WILKOP, spol. s r.o., 756 54 Zubří, Hlavní 823, tel. / fax : 571 627 324 www.wilkop.

Regulační funkce. v aplikaci pro řízení vzduchotechniky. WILKOP, spol. s r.o., 756 54 Zubří, Hlavní 823, tel. / fax : 571 627 324 www.wilkop. Regulační funkce v aplikaci pro řízení vzduchotechniky WILKOP, spol. s r.o., 756 54 Zubří, Hlavní 823, tel. / fax : 571 627 324 OBSAH 1. ÚVOD 2 2. HARDWAROVÁ KONCEPCE REGULÁTORU 2 2.1 ZÁKLADNÍ TECHNICKÉ

Více

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek

Více

Žáci a ICT. Sekundární analýza výsledků mezinárodních šetření ICILS 2013 a PISA 2012

Žáci a ICT. Sekundární analýza výsledků mezinárodních šetření ICILS 2013 a PISA 2012 Žáci a ICT Sekundární analýza výsledků mezinárodních šetření ICILS 2013 a PISA 2012 Praha, květen 2016 Česká republika se již více než 20 let pravidelně účastní mezinárodních šetření v oblasti vzdělávání.

Více

INFORMACE NRL č. 12/2002 Magnetická pole v okolí vodičů protékaných elektrickým proudem s frekvencí 50 Hz. I. Úvod

INFORMACE NRL č. 12/2002 Magnetická pole v okolí vodičů protékaných elektrickým proudem s frekvencí 50 Hz. I. Úvod INFORMACE NRL č. 12/2 Magnetická pole v okolí vodičů protékaných elektrickým proudem s frekvencí Hz I. Úvod V poslední době se stále častěji setkáváme s dotazy na vliv elektromagnetického pole v okolí

Více

Využití modální analýzy pro návrh, posouzení, opravy, kontrolu a monitorování mostů pozemních komunikací

Využití modální analýzy pro návrh, posouzení, opravy, kontrolu a monitorování mostů pozemních komunikací Ministerstvo dopravy TP 215 Odbor silniční infrastruktury Využití modální analýzy pro návrh, posouzení, opravy, kontrolu a monitorování mostů pozemních komunikací Technické podmínky Schváleno MD-OSI č.j.

Více

Reference 10. Předpokládejme stavový popis spojitého, respektive diskrétního systému

Reference 10. Předpokládejme stavový popis spojitého, respektive diskrétního systému Módy systému Teorie dynamických systémů Obsah Úvod 2 Příklady 2 3 Domácí úlohy 8 Reference Úvod Řešení stavových rovnic Předpokládejme stavový popis spojitého, respektive diskrétního systému ẋ(t)=ax(t)+bu(t)

Více

ROZHODNUTÍ. Č.j.: S264/2007-00338/2007/550-VŠ V Praze dne 26.11.2007

ROZHODNUTÍ. Č.j.: S264/2007-00338/2007/550-VŠ V Praze dne 26.11.2007 ÚŘAD PRO OCHRANU HOSPODÁŘSKÉ SOUTĚŽE 604 55 Brno, třída Kpt. Jaroše 7 ROZHODNUTÍ Č.j.: S264/2007-00338/2007/550-VŠ V Praze dne 26.11.2007 Úřad pro ochranu hospodářské soutěže příslušný podle ustanovení

Více

PRAKTIKUM II. Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Název: Charakteristiky termistoru. stud. skup.

PRAKTIKUM II. Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Název: Charakteristiky termistoru. stud. skup. Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK PRAKTIKUM II. Úloha č. IX Název: Charakteristiky termistoru Pracoval: Lukáš Vejmelka stud. skup. FMUZV (73) dne 17.10.2013 Odevzdal

Více

Kybernetika a umělá inteligence, cvičení 10/11

Kybernetika a umělá inteligence, cvičení 10/11 Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu

Více

Řízení pohybu stanice v simulačním prostředí OPNET Modeler podle mapového podkladu

Řízení pohybu stanice v simulačním prostředí OPNET Modeler podle mapového podkladu Rok / Year: Svazek / Volume: Číslo / Number: 2011 13 5 Řízení pohybu stanice v simulačním prostředí OPNET Modeler podle mapového podkladu Map-based mobility control system for wireless stations in OPNET

Více

Rozhodování. s více účastníky. Miroslav. school@utia

Rozhodování. s více účastníky. Miroslav. school@utia Rozhodování s více účastníky Miroslav Kárný school@utia utia.cas.cz, http://www.utia utia.cas.cz/as Rozhodování Účastník znalosti neúpln plné cíle násobné omezení rozsahů složitostn itostní strategie akce

Více