KMI/ZZD Získávání znalostí z dat
|
|
- Bedřich Brož
- před 9 lety
- Počet zobrazení:
Transkript
1 KMI/ZZD Získávání znalostí z dat Úvod, motivace, modely KPD, úlohy DM Jan Konečný 17. února 2015
2 Rozvrh a sylabus Rozvrh: Úterý: 8:00 10:15 (v tom je 1 90 min. přednášky, 1 45 min. cv.) Sylabus Úvod, data mining, data, základní pojmy, reprezentace znalostí. Redukce dimenzionality: principal component analysis, independent component analysis; metody diskretizace dat. Učení bez učitele: shlukování a asociační pravidla. Učení s učitelem: Rozhodovací stromy, pravidlové algoritmy, hybridní algoritmy. Neuronové sítě. Metoda GUHA, další okrajová témata. Zápočet & zkouška obojí za úkoly zadávané v průběhu semestru.
3 Doporučená literatura Berka P. Dobývání znalostí z databází. Academia, Praha, z z Tan P., Steinbach M., Kumar V. Introduction to Data Mining. Addison Wesley, 2005.
4 Hand D. J., Mannila H., Smyth P. Principles of Data Mining. MIT Press, Cambridge, MA, absenční výpujčka v knihovně PřF, prezenční výpujčka v knihovně PřF, z, z výpujčka v knihovně Zbrojnice, ftk, ftk výpujčka v knihovně FTK,... w k dispozici na webu, není k dispozici v knihovnách UP.
5 Další doporučená literatura Duda R. O., Hart P. E., Stork D. G., Pattern Classification, Wiley, 2000 Cios K. J., Pedrycz W., Swiniarski R. W., Kurgan L. A., Data Mining: A Knowledge Discovery Approach, Springer, 2007
6 Co je Data Mining (DM)? Cíl DM je dát smysl velkému množství z velké části neoznačených dat v nějaké doméně. dát smysl najít novou znalost, která má být: pochopitelná pro uživatele/vlastníka dat, který z nich chce mít užitek. Nejvhodnější bude znalost nebo model dat, který může být popsán snadno-pochopitelnými pojmy. Např. pravidly jako: IF abnormalita (obstrukce) věnčitých tepen THEN ischemická srdeční choroba platná jasné; nová nalezení obecně známých nebo triviálních věcí by bylo uživatelem/vlastníkem dat považováno za selhání. užitečná.
7 Co je Data Mining (DM)? velkému množství dat DM není o zkoumání malých datasetů; ty mohou být zkoumány běžnými technikami, nebo dokonce manuálně. AT&T obslouží 300 milionů hovorů denně, obslouží 100 milionů zákazníků děnně, uloží asi terabyte dat denně. Wal-Mart 21 milionů transakcí denně, zhruba 12 terabytů NASA generuje několik gigabajtů za hodinu (Earth Observing System) Moderní biologie data pro lidský genom jsou v řádu terabytů/pentabytů. Taková data nemůžou být přímo zkoumána algoritmicky, natož tak manuálně. Je potřeba provést redukci dat kvantity i dimenze.
8 z velké části neoznačených dat Je levnější a jednodušší sbírat neoznačená data. Označená data musí mít známe vstupy asociované se známými výstupy. Např. vstup: obraz srdce a okolních žil, výstup: diagnóza. (musí určovat kardiolog náročný a na chyby náchylný proces) Když jsou sbírána jenom neoznačená data: Potřebujeme algoritmy, které jsou schopny najít přirozené seskupení/shluky, vztahy a asociace v datech. Pokud bychom našli shluky, může je pojmenovat doménový expert. Tím se z neoznačených dat stanou označená (jednoduchým procesem). Hledání shluků, vztahů a asociace je otevřený vědecký problém. Současné algoritmy mají pořád ještě vady: Shlukování (clustering) nutno předem specifikovat počet shluků. Dolování asociačních pravidel nutno předem zadat číselné parametry k vygenerování vhodně velké množiny asociací.
9 pokud jsou sbíraná data z části označená: tj. pár vstupů s výstupy a k tomu velké množství neoznačených dat. Existují techniky (semi-supervised learning), které může pro označené vstupy využít. pokud jsou sbíraná data zcela označená: většina DM technik s nimi pracuje velice dobře (možná až na škálovatelnost).... dat v nějaké doméně Úspěch DM projektu velmi závisí na přístupu ke znalosti domény. Ti, kdo dělají DM musí úzce spolupracovat s doménovými experty/vlastníky dat. Objevení nových znalostí z dat je interaktivní a iterativní proces. Nemůžeme jednoduše vzít DM systém vybudovaný pro nějakou doménu, aplikovat ji na jinou a očekávat dobré výsledky.
10 Co je DM? DM vzniklo jako odpověď na technologický pokrok v mnoha různých disciplínách. počítačové inženýrství silnější počítače (rychlost, pamět) informatika + matematika efektivnější architektura databází a vyhledávací algoritmy kombinace obojího vylepšení technik pro sběr, ukládání a přenos velkých objemů dat (pro image processing, digital signal processing, text processing,... ) Potřeba lepších, rychlejších a levnějších způsobů, jak s těmi daty zacházet: Data jsou k ničemu bez mechanismů, které z nich efektivně extrahují znalosti. První DM průkopníci: U. Fayyad, H. Mannila, G. Piatetsky-Shapiro, G. Djorgovski, W. Frawley, P. Smith a další.
11 Proces získávaní znalosti z dat (Knowledge discovery process) před pokusem extrahovat užitečné znalosti z dat, je důležité pochopit celkový přístup. to, že zám mnoho algoritmů pro analýzu dat, není dostatečné pro úspěšný projekt DM.
12 teď se budeme zabývat procesem, který vede k objevení nových znalostí (KDP). KDP definuje sekvenci kroků (s možnými cykly), které by měly být následovány k objevení znalosti v datech. Každý krok je obvykle realizován pomocí softwarových nástrojů. Pojem model procesu pomáhá organizacím lépe porozumět KDP, nabízí plán k plánování a vykonání procesu, vede k úsporám (času i financí), lepšímu porozumění a přijatelnosti výsledků.
13 Knowledge discovery process Je několik důvodů proč strukturovat KDP jako standardizovaný model procesu: Koncový produkt musí být užitečný pro uživatele/vlastníka dat. Nestrukturované používání technik DM na slepo (tzv. bagrování dat; data dredging) často vyprodukuje výsledky, které sice můžou být zajímavé, ale nepřispívají k řešení uživatelova problému. Skrze dobře definované KDP modely se dosáhne výsledků, které jsou nové, platné, pochopitelné a užitečné. Dobře definovaný KDP model by měl být logický, soudržný, mít dobře promyšlenou strukturu a přístup, který může být prezentován zákazníkovi. Smrtelníci mnohdy nechápou potenciál znalostí skrytých ve velkých datech a nechtějí věnovat čas a prostředky k jejich extrakci. Místo toho se spoléhají schopnosti a znalosti jiných (např. doménových expertů). Je potřeba jim představit dobrý KPD model.
14 Projekty KD vyžadují značné úsilí v project managementu, které potřebuje být zakotvený v pevném frameworku. Většina KD projektů zahrnuje týmovou práci, plánovaní a rozvrhování. Specialisté na project management obvykle nejsou obeznámeni s pojmy DM a KPD model KPD jim má pomoct vytvořit vhodný plán. KD by mělo následovat příkladu jiných inženýrských disciplín, které už mají stanovené modely. Dobrý příklad je softwarové inženýrství relativně nová disciplína, která má hodně společného s KD. Softwarové inženýrství adoptovalo několik vývojových modelů (vodopád, spirála,... ), které se staly známými standardy v této oblasti.
15 Co je KDP? Data mining už jsme popsali. (alternativní názvy jsou: knowledge extraction, information discovery, information harvesting, data archelogy, data pattern processing). Knowledge discovery process Netriviální proces identifikace platných, nových, potenciálně užitečných a pochopitelných vzorů v datech. Skládá se z více kroků (jeden z nich je DM). KD se zabývá celým procesem extrakce znalostí (knowledge extraction), včetně toho, jak jsou data uložena, jak je k nim přistupováno, jak použít efektivní a škálovatelné algoritmy k analýze masivních datasetů, jak interpretovat vizualizovat a výsledky...
16 Modely KDP KPD model sestává z kroků, které by měly být následovány, když je spouštěn KDP. Od 90. let několik bylo vyvinuto různých KDP. První v akademickém výzkumu, průmysl rychle následoval. Společné pro všechny modely je: skládají z nějakého počtu kroků (liší se počtem a rozsahem). Každý krok je inicializován úspěšným dokončením předchozího kroku. Výstup předchozího kroku slouží jako vstup do nového kroku. definice vstupů a výstupů: typický vstup zahrnuje data v nějake podobě. typický výstup je vygenerovaná nová znalost obvykle vyjádřena jako pravidla, vzory, klasifikační modely, asociace, tredny, statistické analýzy,...
17 Akademické modely Snaha zavést KDP model začala v akademickém prostředí. V pol. 90. let, výzkumníci (akademici) začali definovat několika-krokové procedury, které měly provádět uživatele DM nástrojů světem KD. Hlavní důraz: nabídnout posloupnost aktivit, které pomohou vykonat KDP v libovolné doméně. Dva KDP: ti krokový model Fayyad (a spol.) mi krokový model Anand a Buchner.
18 Fayyad (a spol.) KDP model skládá se z devíti kroků: 1 Vývoj a pochopení aplikační domény zahrnuje získání apriorních znalostí a pochopení cílů koncového uživatele. 2 Vytvoření cílového datasetu výběr podmnožiny proměnných a datapointů, které budou použity pro KD. 3 Čištění dat a preprocessing odstranění odlehlých bodů, vypořádání se s šumem a chybějícími hodnotami. 4 Redukce a projekce dat nalezení použitelných atributů použitím redukce dimenze a transformačních metod. 5 Výběr DM úlohy na základě cílů def. v bodě 1 vybere úlohu DM (jako klasifikace, regrese, shlukování,... ) 6 Výběr DM algoritmu výběr metod pro hledání vzorů datech a rozhodnutí jaké modely a parametry pro použitou metodu budou vhodné.
19 7 Data Mining vyprodukovaní vzorů. 8 Interpretace vytěžených vzorů vizualizace vyextrahovaných vzorů a modelů, vizualizace dat na základě vyextrahovaných modelů. 9 Konsolidace výsledků zahrnutí objevené znalosti do systému, dokumentace a reportování interesovaným stranám. Může zahrnovat porovnání a hledání konfliktů s dřívější znalostí. hlavní aplikace: Tento 9ti krokový model byl zahrnut do komerčního KD systému MineSet (viz Purple Insight Ltd. Model byl také použit v mnoha různých doménách včetně inženýrství, medicíny, výroby, e-businessu a vývoje softwaru.
20 Průmyslové modely Průmyslové modely rychle následovaly akademické snahy. Dva reprezentanti: 5ti krokový model Cabena a spol. (s podporou IBM) 6ti krokový model CRISP-DM (stal se hlavním KDP modelem) CRISP-DM (CRoss-Industry Standard Process for Data Mining) konec 90.let Integral Solutions Ltd., NCR, DaimlerChrysler, OHRA. Vývoj tohoto procesu měl velkou podporu, též podporováno programem ESPIRIT financovaným EU.
21 CRISP-DM Šest kroků CRISP-DM: Business Understanding Porozumění problematice Zaměřuje se na pochopení cílů a pořadavků, konvertuje tyto do definice problému DM, navrhuje předběžný plán projektu k dosažení těch cílů. Tento krok je dále rozložen na několik podkroků: stanovení cílů v problémové doméně zhodnocení situace určení cílů DM generování projektového plánu
22 Data Understanding Porozumění datům Začíná inicialním sběrem dat a seznámení se s nimi. Specifické cíle zahrnují identifikaci problémů v kvalitě dat, počáteční vhled do dat, detekce zajímavých podmnožin dat. Podkroky prvotní sběr dat, popis dat, průzkum dat, ověření kvality dat.
23 Data preparation Příprava dat Zahrnuje činnosti, které vedou k vytvoření datového souboru, který bude zpracováván DM metodami. Tato data by měla obsahovat údaje význačné pro danou úlohu, mít podobu, která je vyžadována vlastními DM algoritmy. Zahrnuje selekci dat, čištění dat, transformaci dat, vytváření dat, integrování dat a formátování dat. Toto je nejpracnější část celého procesu. Modeling Modelování Nasazení metod DM, výběr vhodné metody, určení parametrů, kombinace výsledků různých metod. Součástí tohoto kroku je i ověřování nalezených znalostí z pohledu metod dobývání znalostí. (např. testování klasifikačních znalostí na nezávislých datech).
24 Evaluation Evaluace Vyhodnocení výsledných znalostí z pohledu zákazníka zda byly splněny cíle formulované při zadání. Deployment Využití výsledků Úprava do podoby, která je přijatelná pro zákazníka. Aplikace výsledků. Chcete vědět víc? Chapman P., Clinton J., Kerber R., Khabaza T., Reinhartz T., Shearer C., Rüdiger W. CRISP-DM 1.0 Step-by-step data mining guide SPSS Inc w
25 Schéma CRISP-DM Business Understanding Data Understanding Deployment Data Data Preparation Modeling Evaluation
26 Kategorie reprezentace dat Pravidla V jejich nejobecnějším formátu, pravidla jsou podmiňovací tvrzení ve tvaru: IF podmínka THEN následek (akce), podmínka a následek jsou deskriptory kousků znalosti o doméně. Pravidlo samotné představuje vztah mezi těmito deskriptory. podmínka a následek jsou tvořeny inf. granulemi. Operační kontext, ve kterém jsou inf. granule formovány a používány, může být stanoven uvážením dostupného formálního systému: množiny, fuzzy množiny, rough sets,... V praxi, doménová znalost je typicky strukurovaná do kolekce pravidel, které mají stejný (nebo podobný) formát IF podmínka je A i THEN následek je B i,
27 Grafy a orientované grafy Uzlu představují koncepty nebo atributy, hrany jsou vztahy mezi nimi. Speciální případ tohoto je konceptuální svaz ve FCA KMI/FCA Formální konceptuální analýza
28 Stromy, rozhodovací stromy (Zakořeněné stromy) jsou speciální kategorie grafů: mají určený kořen, neobsahují cykly. Jednou z nejběžněji používaných struktur jsou rozhodovací stromy. Každý uzel reprezentuje atribut, který nabývá konečného počtu diskrétních hodnot. Hrany vycházející z každého uzlu jsou označeny odpovídajícími hodnotami. w φ c C z ω A a B l φ k ω
29 w φ c C z ω A a B l φ k ω Rozhodovací stromy mohou být jednoduše přeloženy do kolekce pravidel: IF A je c & C je w THEN φ (1) IF A je c & C je z THEN ω (2) IF A je a & B je k THEN ω (3) IF A je a & B je l THEN φ (4) Stromy ale navíc obsahují hierarchii (říkají podle jakých atributů se rozhodovat dříve).
30 Shluky
31 Sítě Mohou být považovány za rozšířené grafy v tom smyslu, že každý uzel má nějakou lokální výpočetní schopnost. Představují nejen znalost samotnou ale obsahují taky výpočet. KMI/UNS Umělé neuronové sítě
32 Úlohy DM Učení bez učitele (unsupervised learning) Paradigma učení bez učitele zahrnuje proces, který automaticky objeví strukturu v datech a nezahrnuje žádný dohled (supervision). shlukování (clustering) Je dán N-dimenzionální dataset, X = {x 1, x 2,..., x N }, kde každé x k je charakterizováno množinou atributů. Chceme určit strukturu X, t.j. identifikovat a popsat skupiny (shluky, clusters) v X.
33 Algoritmus K-means shlukování Když máme N datapointů v R n a předpokládáme, že chceme zformovat c shluků. Vypočítáme součet rozptylů mezi datapointy a množinou prototypů v 1, v 2,..., v c : Q = c i=1 k=1 N u ik x k v i, kde. je Euklidovská vzdálenost mezi x k a v i. Matice rozkladu U = [u ik ], i = 1, 2,..., c; k = 1, 2,..., N její role je přidělit datapointy shlukum. prvky matice U jsou binární: { 1 pokud datapoint k patří do shluku i, u ik = 0 jinak.
34 Matice rozkladu splňuje následující podmínky každý shluk je netriviální, tj. neobsahuje všechny datapointy a jsou neprázdné N 0 < u ik < N, i = 1, 2,..., c k=1 každý datapoint patří do jednoho shluku c u ik = 1, i=1 k = 1, 2,..., N Kolekce všech matic rozkladu bude značena U Jako výsledek minimalizace Q konstruujeme matici rozkladu a množinu prototypů. Formálně vyjadřujeme tento konstrukt jako optimalizační problém s omezeními: Minimální Q vzhledem k v 1, v 2,..., v c a U U. Existuje mnoho přístupů k této optimalizaci. Nejběžnější je K-means.
35 Algoritmus K-means shlukování inicializuj prototypy v i, i = 1, 2,..., c (např. náhodně) iteruj, dokud se Q neustálí: zkonstruuj rozkladovou matici U takto: { 1, pokud d( x k, v i ) = min d( x k, v i ), u ik = 0, jinak. změň prototypy výpočtem průměru N k=1 v i = u ik x k N k=1 u ik
36 Demonstrace algoritmu K-means shlukování
37 Demonstrace algoritmu K-means shlukování
38 Demonstrace algoritmu K-means shlukování
39 Demonstrace algoritmu K-means shlukování
40 Demonstrace algoritmu K-means shlukování
41 Dolování asociačních pravidel (association rules mining) hledájí se zajímavé asociace (vztahy, závislosti) ve velkých datasetech. Aplikace: Market-basket analysis (analýza nákupního košíku, MBA). snaží se najít vzory v chování zákazníků v podobě asociací mezi zbožím, které si zákazníci kupují společně (v jednom nákupu). Například je možno objevit, že zákazníci si kupují mléko a chleba společně, a dokonce že určitý chléb je kupován společně s určitým mlékem. (např. vícezrný chléb a sojové mléko). To může být využito k uspořádání zboží v obchodě; v rozvržení slev (aby neslevili vícezrný chléb i sojové mléko současně)... Toto pravidlo říká, {mléko, máslo} {chleba [25%, 60%]} že když si někdo koupil mléko, tak si koupil i chleba. support 25% znamená, že mléko a chleba dohromady bylo koupeno v 25% případů. confidence 60% znamená, že 60% košíků, které obsahovaly mléko obsahovaly taky chleba.
42 Úlohy DM Učení s učitelem (supervised learning) Máme k dispozici kolekci dat (vzorů) X = {x 1, x 2,..., x N }, jejich charakterizaci: hodnoty kvalitativní proměnné klasifikace hodnoty spojité proměnné regrese, aproximace V klasifikaci: každý datapoint x k má určitý label ω k. kde hodnoty ω k přicházejí z nějaké malé množiny čísel ω {1, 2,..., c}, kde c je počet tříd (class) Cílem je vytvořit klasifikátor (classifier), který je konstrukcí funkce Φ, která datapointům přiřazuje labely.
43 Klasifikace Příklad jednoduchého klasifikátoru: nearest-neighbor klasifikátor Je dána kolekce označených dat, nový datapoint x je klasifikován na základě vzdálenosti mezi ním a ostatních dat. Klasifikujeme x stejnou třídou, jako má její nejbližší soused. 2 1? 0 1
44 k-nearest neighbor klasifikátor Klasifikujeme nový datapoint x, podle hlasování k-nejbližších sousedů (k je obvykle malé liché číslo) 2 1?
45 k-nearest neighbor regresor Výsledek regrese pro nový datapoint x, podle hlasování k-nejbližších sousedů je dán jako vážený průměr ?
46 Další učení: reinforced learning, learning with knowledge hints and semi-supervised learning Reinforced learning něco mezi supervised a unsupervised. Místo přiřazení datapointů k třídám máme méně detailní informaci. Jen potvrzení; potvrzující signál (reinforcement; reinforcement signal). Např. pro c tříd, potvrzující signál r( x) může být { 1 pokud je označení sudé číslo (ω 2, ω 4,... ), r( x) = 1 jinak. Dá se říct, že reinforced learning je učení vedené signálem, který je agregátem detailnějších signálů (používaných v supervised learning) Learning with knowledge hints and semi-supervised learning Málokdy máme data, která jsou supervised, a málokdy máme data bez jakékoli doménové znalosti. Ve velkém datasetu X máme malou část označených datapointů, které vedou k pojmu shlukování s částečným dohledem (partial supervision). Tyto datapointy jsou pevné body, které nám pomáhají navigovat proces určování (objevování) shluků.
Získávání dat z databází 1 DMINA 2010
Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z
Získávání znalostí z dat
Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace
Dobývání a vizualizace znalostí. Olga Štěpánková et al.
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
Dolování asociačních pravidel
Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních
Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011
Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Datová věda (Data Science) akademický navazující magisterský program
Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Získávání znalostí z databází. Alois Kužela
Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Státnice odborné č. 20
Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
Úvod do dobývání. znalostí z databází
POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů
Profitabilita klienta v kontextu Performance management
IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic
GRR získávání znalostí v geografických datech Autoři Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic GRR cílet 2 GRR - Popis systému - cíle systém pro dolování
Vícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
ALGORITMY A DATOVÉ STRUKTURY
Název tématického celku: Cíl: ALGORITMY A DATOVÉ STRUKTURY Metodický list č. 1 Časová složitost algoritmů Základním cílem tohoto tematického celku je vysvětlení potřebných pojmů a definic nutných k popisu
Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma
Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování
1 Systémy pro podporu rozhodování 2. Úvod do problematiky systémů pro podporu rozhodování 2 Připomenutí obsahu minulé přednášky Rozhodování a jeho počítačová podpora Manažeři a rozhodování K čemu počítačová
4 ARCHITEKTURA PODNIKOVÝCH PROCESŮ S ARISEM
41 4 ARCHITEKTURA PODNIKOVÝCH PROCESŮ S ARISEM V této kapitole vysvětlíme potřebu strukturované architektury podnikových procesů, a seznámíme se s běžnými typy modelů, používaných v ARISu k reprezentaci
Katedra kybernetiky, FEL, ČVUT v Praze.
Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz posnova přednášek Přednáška Učitel Obsah 1. J. Kléma Úvod do předmětu, učení s a bez učitele.
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
1 Úvod 1.1 Vlastnosti programového vybavení (SW)
1 Úvod 1.1 Vlastnosti programového vybavení (SW) - dávkové zpracování - omezená distribuce - zakázkový SW - distribuované systémy - vestavěná inteligence - laciný HW - vliv zákazníka 1950 1960 1970 1980
01 Teoretické disciplíny systémové vědy
01 Teoretické disciplíny systémové vědy (systémový přístup, obecná teorie systému, systémová statika a dynamika, úlohy na statických a dynamických systémech, kybernetika) Systémová věda je vědní disciplínou
Zobrazte si svazy a uspořádané množiny! Jan Outrata
LatVis Zobrazte si svazy a uspořádané množiny! Jan Outrata Motivace potřeba visualizovat matematické (algebraické) struktury rychle, přehledně a automaticky počítačovými prostředky ruční kreslení je zdlouhavé
Využití strojového učení k identifikaci protein-ligand aktivních míst
Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita
IBM SPSS Decision Trees
IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Obsah. Zpracoval:
Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč
Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.
Grafy doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 13. března 2017 Jiří Dvorský (VŠB TUO) Grafy 104 / 309 Osnova přednášky Grafy
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.
Nové funkce a technologie v současných a budoucích verzích Invenia. Jiří Kunčar
Nové funkce a technologie v současných a budoucích verzích Invenia Jiří Kunčar jiri.kuncar@cern.ch Obsah úvod vývojový proces verze novinky nové technologie závěr CERN European Organization for Nuclear
Hledání optimální polohy stanic a zastávek na tratích regionálního významu
Hledání optimální polohy stanic a zastávek na tratích regionálního významu Václav Novotný 31. 10. 2018 Anotace 1. Dopravní obsluha území tratěmi regionálního významu 2. Cíle výzkumu a algoritmus práce
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Úvod do problematiky Doc. RNDr. Iveta Mrázová,
Informační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
Umělá inteligence a rozpoznávání
Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních
Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9
Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................
Učící se klasifikátory obrazu v průmyslu
Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
PRAVDĚPODOBNOST A STATISTIKA 1
Metodický list č 1. Název tématického celku: Vymezení role Pravděpodobnosti a Matematické Statistiky v širším celku čisté a aplikované matematiky. Základním cílem tohoto tématického celku je základní pojmy
Pokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační
4. Úvod do paralelismu, metody paralelizace
4. Úvod do paralelismu, metody paralelizace algoritmů Ing. Michal Bližňák, Ph.D. Ústav informatiky a umělé inteligence Fakulta aplikované informatiky UTB Zĺın Paralelní procesy a programování, Zĺın, 26.
1. Dobývání znalostí z databází
1. Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých kruzích mluvit počátkem 90. let. První impuls přišel z Ameriky, kde se na konferencích
StatSoft Úvod do data miningu
StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat
Modelování procesů s využitím MS Visio.
Modelování procesů s využitím MS Visio jan.matula@autocont.cz Co je to modelování procesů? Kreslení unifikovaných či standardizovaných symbolů, tvarů a grafů, které graficky znázorňují hlavní, řídící nebo
Geoinformatika. I Geoinformatika a historie GIS
I a historie GIS jaro 2014 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Motivace Proč chodit na přednášky?
BA_EM Electronic Marketing. Pavel
BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?
Předzpracování dat. Lenka Vysloužilová
Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání
Základy business intelligence. Jaroslav Šmarda
Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování
NAIL072 ROZPOZNÁVÁNÍ VZORŮ
NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační
Cíle supervizovaného učení Ondřej Háva
Cíle supervizovaného učení Ondřej Háva ACREA CR Využíváme více než 40 let zkušeností IBM s hlavním cílem: řízení rozhodovacích procesů Akvizice SPSS společností IBM v říjnu 2009 Přejmenování SPSS CR na
Vizualizace v Information Retrieval
Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby
RUP - Disciplíny. Jaroslav Žáček jaroslav.zacek@osu.cz
RUP - Disciplíny Jaroslav Žáček jaroslav.zacek@osu.cz Disciplíny Množství disciplíny v dané iteraci Disciplíny podle RUP Šest základních: Business modeling - pro pochopení problémové domény Requirements
A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h)
A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h) 2.1 Základy marketingové strategie (2,5h) Učitelé se seznámí se základní marketingovou terminologií a s možnými cestami rozvoje firmy. V
Emergence chování robotických agentů: neuroevoluce
Emergence chování robotických agentů: neuroevoluce Petra Vidnerová, Stanislav Slušný, Roman Neruda Ústav Informatiky, AV ČR Kognice a umělý život VIII Praha 28. 5. 2008 Evoluční robotika: EA & neuronové
Úvod do optimalizace, metody hladké optimalizace
Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady
Metodika konstruování Úvodní přednáška
Metodika konstruování Úvodní přednáška Šimon Kovář Katedra textilních a jednoúčelových strojů 1. Úvod: Cílem přednášky je získání obecných znalostí, definicí a pojmů při projektování technických objektů
Teorie systémů TES 5. Znalostní systémy KMS
Evropský sociální fond. Praha & EU: Investujeme do vaší budoucnosti. Teorie systémů TES 5. Znalostní systémy KMS ZS 2011/2012 prof. Ing. Petr Moos, CSc. Ústav informatiky a telekomunikací Fakulta dopravní
Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV
Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 16. 2. (3h) 2. 3. (4h) 17. 3. (5h) 14. 4. (3h) Úvod, historie a vývoj UI, základní
2. Modelovací jazyk UML 2.1 Struktura UML 2.1.1 Diagram tříd 2.1.1.1 Asociace 2.1.2 OCL. 3. Smalltalk 3.1 Jazyk 3.1.1 Pojmenování
1. Teoretické základy modelování na počítačích 1.1 Lambda-kalkul 1.1.1 Formální zápis, beta-redukce, alfa-konverze 1.1.2 Lambda-výraz jako data 1.1.3 Příklad alfa-konverze 1.1.4 Eta-redukce 1.2 Základy
Příprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
Dynamické programování
Dynamické programování prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA)
= je prostý orientovaný graf., formálně c ( u, v) 0. dva speciální uzly: zdrojový uzel s a cílový uzel t. Dále budeme bez
Síť Síť je čtveřice N = ( G, s, t, c) kde G ( V, A) = je prostý orientovaný graf a každé orientované hraně ( u, v) je přiřazeno nezáporné číslo, které se nazývá kapacita hrany ( u, v), formálně c ( u,
Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.
Úvod (Proč se zabývat statistikou?) Statistika je metoda analýzy dat, která nachází široké uplatnění v celé řadě ekonomických, technických, přírodovědných a humanitních disciplín. Její význam v poslední
RELATIONAL DATA ANALYSIS
KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO RELATIONAL DATA ANALYSIS RADIM BELOHLAVEK, JAN OUTRATA VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM
Metodika konstruování Úvodní přednáška
Metodika konstruování Úvodní přednáška Šimon Kovář Katedra textilních a jednoúčelových strojů 1. Úvod: Cílem přednášky je seznámení studentů s definicemi a pojmy v metodice konstruování. Design Methodology
Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura
Dílčí architektury Informační systémy - dílčí architektury - EIS MIS TPS strategické řízení taktické řízení operativní řízení a provozu 1 Globální Funkční Procesní Datová SW Technologická HW Aplikační
Zpětnovazební učení Michaela Walterová Jednoocí slepým,
Zpětnovazební učení Michaela Walterová Jednoocí slepým, 17. 4. 2019 V minulých dílech jste viděli Tři paradigmata strojového učení: 1) Učení s učitelem (supervised learning) Trénovací data: vstup a požadovaný
xrays optimalizační nástroj
xrays optimalizační nástroj Optimalizační nástroj xoptimizer je součástí webového spedičního systému a využívá mnoho z jeho stavebních bloků. xoptimizer lze nicméně provozovat i samostatně. Cílem tohoto
GIS Geografické informační systémy
GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu
Metody zpracování a analýzy medicínských obrazových dat: možnosti využití v neurovědním výzkumu
Metody zpracování a analýzy medicínských obrazových dat: možnosti využití v neurovědním výzkumu Ing. Daniel Schwarz, Ph.D. Bc. Eva Janoušov ová INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ O čem budu mluvit? Neurovědy
Základy tvorby výpočtového modelu
Základy tvorby výpočtového modelu Zpracoval: Jaroslav Beran Pracoviště: Technická univerzita v Liberci katedra textilních a jednoúčelových strojů Tento materiál vznikl jako součást projektu In-TECH 2,
2. Začlenění HCI do životního cyklu software
Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI
Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně
Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších
Základy vytěžování dat
Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha
Středoškolská technika SCI-Lab
Středoškolská technika 2016 Setkání a prezentace prací středoškolských studentů na ČVUT SCI-Lab Kamil Mudruňka Gymnázium Dašická 1083 Dašická 1083, Pardubice O projektu SCI-Lab je program napsaný v jazyce
Výroční zpráva společnosti Corpus Solutions a.s. za rok Popis účetní jednotky. Název společnosti: Corpus Solutions
Výroční zpráva společnosti Corpus Solutions a.s. za rok 2013 Popis účetní jednotky Název společnosti: Corpus Solutions Sídlo:, Praha 4, 140 00 Právní forma: a.s. IČO: 25764616 Rozhodující předmět činnosti:
Algoritmizace prostorových úloh
INOVACE BAKALÁŘSKÝCH A MAGISTERSKÝCH STUDIJNÍCH OBORŮ NA HORNICKO-GEOLOGICKÉ FAKULTĚ VYSOKÉ ŠKOLY BÁŇSKÉ - TECHNICKÉ UNIVERZITY OSTRAVA Algoritmizace prostorových úloh Grafové úlohy Daniela Szturcová Tento
Trénování sítě pomocí učení s učitelem
Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup
MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR
Váš pomocník pro analýzu dat MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich StatSoft CR StatSoft StatSoft CR Dodavatel komplexních analytických řešení Výhradní dodavatel softwaru STATISTICA pro
Uživatelská podpora v prostředí WWW
Uživatelská podpora v prostředí WWW Jiří Jelínek Katedra managementu informací Fakulta managementu Jindřichův Hradec Vysoká škola ekonomická Praha Úvod WWW obsáhlost obsahová i formátová pestrost dokumenty,
Obsah. Co je to Field-Map? Field-Map software Popis technologie Field-Map Zdroje
Michal Zigo, ZIG012 Obsah Co je to Field-Map? Field-Map software Zdroje Co je to Field-Map? Field-Map je technologie, která vzniká spojením jedinečného software s vhodným hardwarem, takže umožňuje terénní
Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)
..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY)
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka
Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce