Brno. Datová analytika. Machine Learning a Big Data. Jan Studnička
|
|
- Ilona Bohumila Nováková
- před 5 lety
- Počet zobrazení:
Transkript
1 Brno Datová analytika Machine Learning a Big Data Jan Studnička studnicka@humusoft.cz info@humusoft.cz
2 Technické výpočty v MATLABu Přístup k datům Soubory Analýza a řešení Analýza dat a modelování Sdílení výsledků Dokumentace Software Vývoj algoritmů Výsledný návrh Kód a Aplikace Hardware Vývoj aplikací Nasazení aplikací Automatizace
3 Způsoby práce v prostředí MATLAB Zápis kódu Plnohodnotný programovací jazyk Zadávání příkazů Skripty Funkce Objektově orientované programování Interaktivní přístup Využití grafických nástrojů Umožnují generovat kód 3
4 Analýza dat načítání dat a data v MATLABu 4
5 Načítání dat ze souborů Interaktivní nástroj Import Tool Funkce readtable Načte data ze souboru do tabulky v MATLABu Nastavitelné parametry načítání detectimportoptions Parametry pro funkci readtable detekuje z dat 5
6 Načítání dat z databází Interaktivní nástroj Database Explorer ODBC a JDBC kompatibilní databáze Funkce database Vytvoří připojení k databázi select Načte tabulku z databáze do tabulky v MATLABu datový typ importovaných numerických dat určen z databáze 6
7 Další Import a Export Dat Přístup k online datům RESTful, JSON, HTTP, CSV, text, a obrázková data webread, tcpclient Databases Načítání velkých kolekcí dat datastore Text, spreadsheet, database, image custom format datastores Images Custom
8 Tabulky table Různorodá data v tabulkovém formátu Různé typy dat v různých proměnných Text, numerická data, časová data, kategoriální data, Drží data i metadata Zpracování a analýza Voláním funkcí přímo na tabulky Zpracování chybějících a odlehlých údajů Třídění, přeskládání a spojování tabulek Souhrnné statistiky Tvorba modelu, predikce / klasifikace 8
9 Kategoriální data categorical Diskrétní nenumerická data Data nabývají hodnot z konečné množiny kategorií Efektivní z hlediska zabrané paměti Porovnáváme logickými operátory ==, ~= Můžeme zavést uspořádání <, <=, >, >=
10 Datum a čas datetime reprezentuje datum a čas (body na časové ose) duration, calendarduration reprezentují dobu trvání (časové intervaly) Slouží pro výpočty i zobrazení sčítání, odčítání, seřazení, porovnání, vykreslení nastavitelný formát zobrazení přesnost na nanosekundy časové zóny, přestupné sekundy, letní čas
11 Časové tabulky timetable Tabulky s časovými značkami pro jednotlivé řádky indexování dle času Zpracování dat pomocí specializovaných funkcí reorganizace dat změna časové škály synchronizace a spojení časových tabulek Zpracování dat pomocí funkcí pro table
12 Text string Efektivní práce s textovými daty >> "image" + (1:3) + ".png" 1 3 string array "image1.png" "image2.png" "image3.png" Příklad: Ověření, zda je v textovém řetězci obsažen jiný text Dříve: if ~isempty(strfind(textdata,"dog")) Nyní: if contains(textdata,"dog")) Až 50x rychlejší výpočet s funkcí contains a datovým typem string než se strfind a cellstr. Až 2x méně využité paměti s datovým typem string oproti cellstr.
13 Předzpracování dat Zpracování chybějících dat pomocí *missing funkcí Manipulace s textem pomocí replace, contains, endswith, a dalších Vyhlazení dat pomocí filtrace nebo lokální regrese smoothdata Práce s odlehlými pozorováními isoutlier, filloutliers
14 Analýza dat Split-Apply-Combine Workflow findgroups rozdělí data do skupin splitapply aplikuje funkci na každou skupinu a zkombinuje výsledky Detekce lokálních extrémů islocalmin and islocalmax Detekce náhlých změn v datech ischange
15 Machine Learning nové algoritmy a přístupy 15
16 Strojové učení Typ učení Kategorie algoritmu Klasifikace Support Vector Machines Discriminant Analysis Naive Bayes Nearest Neighbor Učení s učitelem Strojové učení Cíl: předpovědní model založený na vstupních a výstupních datech Regrese Linear Regression, GLM, Nonlinear Regression GPR, SVR Ensemble Methods Decision Trees Neural Networks Učení bez učitele Shluková analýza kmeans, kmedoids Fuzzy C-Means Hierarchical Gaussian Mixture Cíl: seskupení a interpretace dat založená pouze na vstupních datech Neural Networks Hidden Markov Model
17 Postup při strojovém učení Fáze učení: hledání nejlepšího modelu TRÉNOVACÍ DATA ÚPRAVA DAT UČENÍ S UČITELEM MODEL FILTRACE PCA CLASIFIKACE SOUHRNNÉ STATISTIKY SHLUKOVÁ ANALÝZA REGRESE Predikce: začlenění výsledného modelu do koncové aplikace NOVÁ DATA ÚPRAVA DAT MODEL PREDIKCE FILTRACE PCA SOUHRNNÉ STATISTIKY SHLUKOVÁ ANALÝZA
18 Výběr a extrakce prediktorů Výběr prediktorů Neighborhood component analysis fscnca, fsrnca Extrakce prediktorů Sparse filtering, Reconstruction ICA sparsefilt, rica transform Vizualizace vícedimenzionálních dat t-distributed Stochastic Neighbor Embedding tsne 18
19 Klasifikace a regrese Trénování modelu fit* SVM, ECOC, Ensemble, regrese, stepwise* kroková regrese Predikce a diagnostiky vlastnosti a metody modelu predict 19
20 Nové efektivní algoritmy optimalizace hyperparametrů bayesovská optimalizace klasifikace a regrese pro Big Data techniky pro snížení výpočetní náročnosti trénování modelu SVM, ECOC, logistická regrese stochastic gradient descent, LBFGS, aj. Gaussian kernel classification / regression random feature expansion 20
21 Nové interaktivní aplikace Aplikace Toolbox Uvedeno Classification Learner Statistics and Machine Learning Signal Analyzer Regression Learner Wavelet Signal Denoiser Econometric Modeler Signal Processing Statistics and Machine Learning Wavelet Econometrics 21
22 Big Data tall array 22
23 Big Data tall Případy využití: Sloupcová data s mnoho řádky Příliš mnoho dat, aby se vešly do paměti Operace jsou povahou statistické Pro statistické výpočty i Machine Learning Stovky funkcí v základním MATLABu a Statistics and Machine Learning Toolbox Automaticky optimalizuje přistupování k datům Tall Data Machine Memory Na desktopu, clusteru, nebo clusteru s nástroji Hadoop a Spark 23
24 Big Data bez velkých změn Jeden soubor Sto souborů 24
25 Big Data Workflow Access Data Tall Data Types Exploration & Pre-processing Machine Learning Text Spreadsheet (Excel) Database (SQL) Custom Reader Datastores for common types of structured data table cell double numeric cellstr datetime categorical Tall versions of commonly used MATLAB data types Numeric functions Summary stats reductions Date/Time capabilities Categorical String processing Table wrangling Missing data handling Summary visualizations: Histogram/histogram2 Kernel density plot Bin-scatter Hundreds of pre-built functions Linear Model Logistic Regression Discriminant Analysis Decision trees classif. K-means PCA Random data sampling Summary statistics Validation techniques Key statistics and machine learning algorithms Tall data types and functions for use with out-of-memory data
26 Big Data vizualizace pomocí tall Podpora pro: histogram histogram2 ksdensity plot scatter binscatter confusionmat Podpora dále bude růst! 26
27 Tall Array Run in parallel on compute clusters MATLAB Distributed Computing Server Local disk Shared folders Databases Compute Clusters Spark + Hadoop Tall arrays MATLAB 100 s of functions supported MATLAB Statistics and Machine Learning Toolbox Run in parallel Parallel Computing Toolbox Run in parallel on Spark clusters MATLAB Distributed Computing Server Deploy MATLAB applications as standalone applications on Spark clusters MATLAB Compiler 27
28 Kontakty Pobřežní Praha 8 Česká republika info@humusoft.cz Tel.:
MATLAB: Vývoj a nasazení finančních aplikací
7. 6. 2016 Master Class MATLAB: Vývoj a nasazení finančních aplikací Jan Studnička studnicka@humusoft.cz info@humusoft.cz www.humusoft.cz www.mathworks.com Obsah Nároky na finanční modelování Příklady
Efektivní práce s daty v prostředí MATLAB. Nové datové typy, nové přístupy, Big Data, využití ve finančních aplikacích
05.06.2018 Efektivní práce s daty v prostředí MATLAB Nové datové typy, nové přístupy, Big Data, využití ve finančních aplikacích Jan Studnička studnicka@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
MATLAB & Simulink. Matematické výpočty, analýza dat a tvorba aplikací. Jaroslav Jirkovský jirkovsky@humusoft.cz. www.humusoft.cz info@humusoft.
MATLAB & Simulink Matematické výpočty, analýza dat a tvorba aplikací Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 Obsah Úvod novinky R2010a Matematické
Aplikace obrazové fúze pro hledání vad
Marek Vajgl, Irina Perfilieva, Petr Hurtík, Petra Hoďáková Národní superpočítačové centrum IT4Innovations Divize Ostravské univerzity Ústav pro výzkum a aplikaci fuzzy modelování Ostrava, Česká republika
Příprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
Pokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační
Předmluva 9 Obsah knihy 9 Typografické konvence 10 Informace o autorovi 10 Poděkování 10
Obsah Předmluva 9 Obsah knihy 9 Typografické konvence 10 Informace o autorovi 10 Poděkování 10 KAPITOLA 1 Úvod 11 Dostupná rozšíření Matlabu 13 Alternativa zdarma GNU Octave 13 KAPITOLA 2 Popis prostředí
LabView jako programovací jazyk II
LabView jako programovací jazyk II - Popis jednotlivých funkcí palety Function II.část - Funkce Numeric, Array, Cluster Ing. Martin Bušek, Ph.D. Práce s daty typu NUMERIC Numerické funkce obsahuje funkce
Programování LEGO MINDSTORMS s použitím nástroje MATLAB a Simulink
26.1.2018 Praha Programování LEGO MINDSTORMS s použitím nástroje MATLAB a Simulink Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com Co je MATLAB a Simulink 2
MATLAB a Simulink R2015b
MATLAB a Simulink R2015b novinky ve výpočetním systému Jan Houška HUMUSOFT s.r.o. houska@humusoft.cz 1 >> 2016 1991 ans = 25 2 Release 2015a a 2015b tradiční dvě vydání do roka březen a září 2015 R2015a
Self Organizing Map. Michael Anděl. Praha & EU: Investujeme do vaší budoucnosti. 1 / 10 Slef Organizing Map
Vytěžování dat 6: Self Organizing Map Michael Anděl Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Fakulta elektrotechnická, ČVUT 1 / 10 Slef Organizing Map SOM Toolbox V dnešním cvičení
Paralelní výpočty ve finančnictví
Paralelní výpočty ve finančnictví Jan Houška HUMUSOFT s.r.o. houska@humusoft.cz Výpočetně náročné úlohy distribuované úlohy mnoho relativně nezávislých úloh snížení zatížení klientské pracovní stanice
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
Možnosti aplikace: Copyright 2001, COM PLUS CZ, Praha
Vyhodnocovací program CP TARIF 2001 umožňuje rychlé a podrobné sledování telefonního provozu pobočkových ústředen. Uživatel programu tak získává všechny potřebné údaje o odchozích telefonních hovorech,
IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM
IBM SPSS Software IBM SPSS Modeler Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. IBM SPSS Modeler je komlpexní
MATLAB. Měření a analýza dat, statistika a optimalizace. Jaroslav Jirkovský jirkovsky@humusoft.cz. www.humusoft.cz info@humusoft.cz. www.mathworks.
MATLAB Měření a analýza dat, statistika a optimalizace Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 Obsah Úvod Statistická analýza dat v MATLABu Načítání
Hledání optimální polohy stanic a zastávek na tratích regionálního významu
Hledání optimální polohy stanic a zastávek na tratích regionálního významu Václav Novotný 31. 10. 2018 Anotace 1. Dopravní obsluha území tratěmi regionálního významu 2. Cíle výzkumu a algoritmus práce
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19
Předmluva 13 O autorovi 15 Poděkování 16 O odborných korektorech 17 Úvod 19 Co kniha popisuje 19 Co budete potřebovat 20 Komu je kniha určena 20 Styly 21 Zpětná vazba od čtenářů 22 Errata 22 KAPITOLA 1
Profilová část maturitní zkoušky 2017/2018
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2017/2018 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 78-42-M/01 Technické lyceum Předmět: TECHNIKA
Profilová část maturitní zkoušky 2013/2014
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2013/2014 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 78-42-M/01 Technické lyceum Předmět: TECHNIKA
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová 5. Statistica StatSoft, Inc., http://www.statsoft.com, http://www.statsoft.cz. Verze pro Mac i PC, dostupná
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
IBM SPSS Modeler Professional
IBM SPSS Modeler Professional 16 IBM SPSS Software IBM SPSS Modeler Professional Včasné rozhodnutí díky přesným informacím Metodami data miningu získáte detailní přehled o svém současném stavu i jasnější
Idrisi Andes aneb co bude nového ve verzi 15.0
Idrisi Andes aneb co bude nového ve verzi 15.0 Ing. Martin KLIMÁNEK Mendelova zemědělská a lesnická univerzita v Brně Lesnická a dřevařská fakulta Ústav 411 Geoinformačních technologií Idrisi 15.0 The
MATLAB. Matematické výpočty, analýza dat a tvorba aplikací. Jaroslav Jirkovský jirkovsky@humusoft.cz. www.humusoft.cz info@humusoft.
MATLAB Matematické výpočty, analýza dat a tvorba aplikací Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 O společnosti HUMUSOFT Název firmy: Humusoft s.r.o.
xrays optimalizační nástroj
xrays optimalizační nástroj Optimalizační nástroj xoptimizer je součástí webového spedičního systému a využívá mnoho z jeho stavebních bloků. xoptimizer lze nicméně provozovat i samostatně. Cílem tohoto
MATLAB Úvod. Úvod do Matlabu. Miloslav Čapek
MATLAB Úvod Úvod do Matlabu Miloslav Čapek Proč se na FELu učit Matlab? Matlab je světový standard pro výuku v technických oborech využívá ho více než 3500 univerzit licence vlastní tisíce velkých firem
Lukáš Brodský www.gisat.cz. Praha 2008. Osnova. Objektový přístup Verze 4, 5, 6 / 7 Developer7 -funkčnost, nové vlastnosti HW
Nové možnosti objektověorientované klasifikace v Definiens Lukáš Brodský www.gisat.cz GISAT Praha 2008 Osnova Objektový přístup Verze 4, 5, 6 / 7 Developer7 -funkčnost, nové vlastnosti HW Objektový přístup
IBM SPSS Decision Trees
IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích
ití empirických modelů při i optimalizaci procesu mokré granulace léčivl ková SVK ÚOT
Využit ití empirických modelů při i optimalizaci procesu mokré granulace léčivl Jana Kalčíkov ková 5. ročník Školitel: Doc. Ing. Zdeněk k Bělohlav, B CSc. Granulace Prášek Granule Vlhčivo Promíchávání
Algoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím
GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER váš partner na cestě od dat k informacím globtech spol. s r.o. karlovo náměstí 17 c, praha 2 tel.: +420 221 986 390 info@globtech.cz
Fyzické uložení dat a indexy
Fyzické uložení dat a indexy Michal Valenta Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze c Michal Valenta, 2016 BI-DBS, LS 2015/16 https://edux.fit.cvut.cz/courses/bi-dbs/
Informační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
Vstupní požadavky, doporučení a metodické pokyny
Název modulu: Základy PHP Označení: C9 Stručná charakteristika modulu Modul je orientován na tvorbu dynamických stánek aktualizovaných podle kontextu volání. Jazyk PHP umožňuje velmi jednoduchým způsobem
Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy
Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy Konvence Další prvky Požadavky na systém Ukázkové databáze Ukázky kódu Použití ukázek kódu Další
NG C Implementace plně rekurentní
NG C Implementace plně rekurentní neuronové sítě v systému Mathematica Zdeněk Buk, Miroslav Šnorek {bukz1 snorek}@fel.cvut.cz Neural Computing Group Department of Computer Science and Engineering, Faculty
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
Workshop. Vývoj embedded aplikací v systému MATLAB a Simulink. Jiří Sehnal sehnal@humusoft.cz. www.humusoft.cz info@humusoft.cz. www.mathworks.
Workshop Vývoj embedded aplikací v systému MATLAB a Simulink Jiří Sehnal sehnal@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 Obsah workshopu Model Based Design model soustavy a regulátoru
Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU 1 2 4 bez limitu Obsahuje podporu
Srovnání SQL serverů Škálovatelnost a výkon Počet CPU 1 2 4 bez limitu Obsahuje podporu RAM 1 GB 3 GB bez limitu bez limitu vícejádrových (multicore) procesorů 64-bit podpora Windows on Windows (WOW) WOW
Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9
Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................
Microsoft Access tvorba databáze jednoduše
Microsoft Access tvorba databáze jednoduše Časový rozsah: 2 dny (9:00-16:00) Cena: 3300 Kč + DPH Úvod do relačních databází. Funkce databázových objektů Microsoft Access. Návrh tabulek, definice základních
Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner
Vysoká škola ekonomická v Praze Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner Dobývání znalostí z databází 4IZ450 XXXXXXXXXXX Přidělená data a jejich popis Data určená pro zpracování
Tabulkový procesor. Základní rysy
Tabulkový procesor Tabulkový procesor je počítačový program zpracovávající data uložená v buňkách tabulky. Program umožňuje použití vzorců pro práci s daty a zobrazuje výsledné hodnoty podle vstupních
MATLAB. Matematické výpočty, analýza dat a tvorba aplikací. Jaroslav Jirkovský jirkovsky@humusoft.cz. www.humusoft.cz info@humusoft.
MATLAB Matematické výpočty, analýza dat a tvorba aplikací Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 O společnosti HUMUSOFT Název firmy: Humusoft s.r.o.
Systém je citlivý na velikost písmen CASE SENSITIVE rozeznává malá velká písmena, např. PROM=1; PROm=1; PRom=1; Prom=1; prom=1; - 5 různých proměnných
Systém je citlivý na velikost písmen CASE SENSITIVE rozeznává malá velká písmena, např. PROM=1; PROm=1; PRom=1; Prom=1; prom=1; - 5 různých proměnných jakési nádoby na hodnoty jsou různých typů při běžné
PowerPivot pro Microsoft Excel 2013
Časový rozsah: 1 den (9:00-16:00) Cena: 2500 Kč + DPH PowerPivot pro Microsoft Excel 2013 Kurz je určen uživatelům Microsoft Excel 2013, kteří se chtějí naučit využívat doplněk PowerPivot pro Excel 2013
Business Intelligence
Business Intelligence Josef Mlnařík ISSS Hradec Králové 7.4.2008 Obsah Co je Oracle Business Intelligence? Definice, Od dat k informacím, Nástroj pro operativní řízení, Integrace informací, Jednotná platforma
Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických
Lineární algebra s Matlabem. Přednáška 1
Lineární algebra s Matlabem Přednáška 1 Základní informace Kontakt Michal Merta michal.merta@vsb.cz Kancelář IT447 homel.vsb.cz/~mer126 Čt 16:00 (předn.), 17:45 (cv.), PorEB413 Konzultace po předchozí
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Úvod do RapidMineru. Praha & EU: Investujeme do vaší budoucnosti. 1 / 23 Úvod do RapidMineru
Vytěžování dat, cvičení 2: Úvod do RapidMineru Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Fakulta elektrotechnická, ČVUT 1 / 23 Úvod do RapidMineru Dnes vám ukážeme jeden z mnoha
Maple 2015 poskytuje novou infrastrukturu pro přístup a práci s miliony dat, a to nejen s daty vestavěných typů, ale i s daty online.
Novinky v Maple 2015 Firma Maplesoft uvádí na trh novou verzi svého systému Maple tentokrát s označením Maple 2015. Jako obvykle přináší mnoho nových rozšíření, vylepšení a zrychlení a posouvá tedy matematické
Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012
Statistické metody v digitálním zpracování obrazu Jindřich Soukup 3. února 2012 Osnova Úvod (Neparametrické) odhady hustoty pravděpodobnosti Bootstrap Použití logistické regresi při klasifikaci Odhady
Matematika v programovacích
Matematika v programovacích jazycích Pavla Kabelíková am.vsb.cz/kabelikova pavla.kabelikova@vsb.cz Úvodní diskuze Otázky: Jaké programovací jazyky znáte? S jakými programovacími jazyky jste již pracovali?
Wonderware Information Server 4.0 Co je nového
Wonderware Information Server 4.0 Co je nového Pavel Průša Pantek (CS) s.r.o. Strana 2 Úvod Wonderware Information Server je výrobní analytický a reportní informační portál pro publikaci výrobních dat
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
Klasifikační metody pro genetická data: regularizace a robustnost
Odd medicínské informatiky a biostatistiky Ústav informatiky AV ČR, vvi Práce vznikla za finanční podpory Nadačního fondu Neuron na podporu vědy Klasifikační metody pro genetická data Regularizovaná klasifikační
FOSS4G úspěšné projekty
FOSS4G úspěšné projekty Erika Orlitová GISAT knihovna GDAL - Geospatial Data Abstraction Library vývoj je podporován OSGeo, licence X/MIT práce s rastrovými formáty na úrovni příkazové řádky informace
Databázové systémy Cvičení 5.2
Databázové systémy Cvičení 5.2 SQL jako jazyk pro definici dat Detaily zápisu integritních omezení tabulek Integritní omezení tabulek kromě integritních omezení sloupců lze zadat integritní omezení jako
Microsoft Access. Typy objektů databáze: Vytvoření a návrh nové tabulky. Vytvoření tabulky v návrhovém zobrazení
Microsoft Access Databáze je seskupení většího množství údajů, které mají určitou logiku a lze je určitým způsobem vyhodnocovat, zpracovávat a analyzovat Access je jedním z programů určených pro zpracování
IBM SPSS Modeler Premium
IBM SPSS Modeler Premium 16 IBM SPSS Software IBM SPSS Modeler Premium Modelování strukturovaných a nestrukturovaných dat, identifikace entit a analýza sociálních sítí IBM SPSS Modeler Premium je software
1 Webový server, instalace PHP a MySQL 13
Úvod 11 1 Webový server, instalace PHP a MySQL 13 Princip funkce webové aplikace 13 PHP 14 Principy tvorby a správy webového serveru a vývojářského počítače 14 Co je nezbytné k instalaci místního vývojářského
SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek
SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek NÁSLEDUJÍCÍCH 25 MINUT Proč je letošní prezentace modro-zelená Vyhledávání a Big data Search architektura s využitím Big data Co to může přinést
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/29 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
INFORMAČNÍ TECHNOLOGIE PRO ZPRACOVÁNÍ EEG 2 UNIS a popis EEG. doc. Ing. Vladimír Krajča CSc.
INFORMAČNÍ TECHNOLOGIE PRO ZPRACOVÁNÍ EEG 2 UNIS a popis EEG doc. Ing. Vladimír Krajča CSc. 1. Úkol: a. Číst a zobrazit digitalizovaná data EEG různých výrobců s různými formáty dat b. Číst a využít archív
Předmluva 11 Typografická konvence použitá v knize 12. 1 Úvod do Excelu 2003 13
Předmluva 11 Typografická konvence použitá v knize 12 1 Úvod do Excelu 2003 13 Spuštění a ukončení Excelu 14 Spuštění Excelu 14 Ukončení práce s Excelem 15 Přepínání mezi otevřenými sešity 16 Oprava aplikace
Maturitní otázky z předmětu PROGRAMOVÁNÍ
Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace Maturitní otázky z předmětu PROGRAMOVÁNÍ 1. Algoritmus a jeho vlastnosti algoritmus a jeho vlastnosti, formy zápisu algoritmu ověřování správnosti
MATLAB & Simulink. novinky v roce 2008. Jan Houška houska@humusoft.cz. HUMUSOFT s.r.o.
MATLAB & Simulink novinky v roce 2008 Jan Houška houska@humusoft.cz Release 2008a a 2008b nové produkty SimElectronics Econometrics Toolbox významné aktualizace MATLAB Symbolic Math Toolbox Parallel Computing
ADS DOCHÁZKOVÝ SOFTWARE
DOCHÁZKOVÝ SOFTWARE Program ADS je komfortní a sofistikovaný software pro zpracování docházky na základě dat načtených systémem ACS-line. Umožňuje libovolnou práci s daty a výpočty dle nastavených směn
BIG DATA je oveľa viac ako Hadoop. Martin Pavlík
BIG DATA je oveľa viac ako Hadoop Martin Pavlík Analýza všech dostupných dat? Big data =? = Buzzword? = Hadoop? Hadoop Jen ke zpracování nestrukturovaných dat? Mentální posun něco za něco 2 Big data =
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Datová věda (Data Science) akademický navazující magisterský program
Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.
Algoritmizace, základy programování, VY_32_INOVACE_PRG_ALGO_01
Anotace sady: Algoritmizace, základy programování, VY_32_INOVACE_PRG_ALGO_01 Autor: Blanka Sadovská Klíčová slova: Algoritmus, proměnná, diagram Stupeň a typ vzdělávání: gymnaziální vzdělávání, 3. ročník
Strojové učení se zaměřením na vliv vstupních dat
Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications
Pokročilé metody geostatistiky v R-projektu
ČVUT V PRAZE, Fakulta stavební, Geoinformatika Pokročilé metody geostatistiky v R-projektu Autoři: Vedoucí projektu: RNDr. Dr. Nosková Jana Studentská grantová soutěž ČVUT 2011 Praha, 2011 Geostatistika
Databázové a informační systémy
Databázové a informační systémy doc. Ing. Miroslav Beneš, Ph.D. katedra informatiky FEI VŠB-TUO A-1007 / 597 324 213 http://www.cs.vsb.cz/benes Miroslav.Benes@vsb.cz Obsah Jak ukládat a efektivně zpracovávat
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Analýzou dat k efektivnějšímu rozhodování
Analýzou dat k efektivnějšímu rozhodování Chytrá řešení pro veřejnou správu Václav Bahník, ECM Solution Consultant Marek Šoule, ECM Software Sales Representative 8.4.2013 Řízení efektivního poskytování
Škály podle informace v datech:
Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se? x 1 = x 2 Data ordinální Větší, menší? x 1 < x 2 Data intervalová O kolik?
Diplomová práce. On-line databáze provozních dat pro laboratorní odparku. Jan Polnický VŠCHT FCHI, ASŘ 2001/2002
Diplomová práce On-line databáze provozních dat pro laboratorní odparku Jan Polnický VŠCHT FCHI, ASŘ 00/00 Náplň práce v Seznámení s problematikou daného tématu seznámení s produkty Oracle a TomPack odlišnosti
Data Science projekty v telekomunikační společnosti
Data Science projekty v telekomunikační společnosti Jan Romportl Chief Data Scientist, O2 Czech Republic Data, mapa a teritorium Data Science Mezioborová technicky orientovaná oblast, která se zabývá inovativním
Tabulkový procesor otázka č.17
Tabulkový procesor otázka č.17 Seřazení (sort = řazení, třídění) je přeorganizování seznamu nebo jakékoli jiné tabulky podle klíčů. Klíč představuje vybrané pole seznamu, podle kterého se na základě zvoleného
MATLAB & Simulink. Návrh digitálních filtrů pro úpravu signálů a analýza obrazu. Jaroslav Jirkovský jirkovsky@humusoft.cz
MATLAB & Simulink Návrh digitálních filtrů pro úpravu signálů a analýza obrazu Jaroslav Jirkovský jirkovsky@humusoft.cz www.humusoft.cz info@humusoft.cz www.mathworks.com 1 Obsah Úvod Zpracování signálu
1 Základní funkce pro zpracování obrazových dat
1 Základní funkce pro zpracování obrazových dat 1.1 Teoretický rozbor 1.1.1 Úvod do zpracování obrazu v MATLABu MATLAB je primárně určen pro zpracování a analýzu numerických dat. Pro analýzu obrazových
SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek
Prezentace aplikace Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek Osnova Úvod Programovací jazyk - PHP Etapy vývoje Funkce aplikace Co SW umí Na čem se pracuje Vize do budoucna Úvod Úvod Inspirováno
VZOROVÝ STIPENDIJNÍ TEST Z INFORMAČNÍCH TECHNOLOGIÍ
VZOROVÝ STIPENDIJNÍ TEST Z INFORMAČNÍCH TECHNOLOGIÍ 1. Dědičnost v OOP umožňuje: a) dědit vlastnosti od jiných tříd a dále je rozšiřovat b) dědit vlastnosti od jiných tříd, rozšiřovat lze jen atributy
Rozpoznávání v obraze
Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd
Univerzální prohlížeč naměřených hodnot
Návod na používání autorizovaného software Univerzální prohlížeč naměřených hodnot V Ústí nad Labem 14. 8. 2009 Vytvořil: doc. Ing., Ph.D. 1 z 10 Obsah 1Úvod...3 2Instalace...3 3Spuštění programu...3 3.1Popis
Databáze I. Přednáška 4
Databáze I Přednáška 4 Definice dat v SQL Definice tabulek CREATE TABLE jméno_tab (jm_atributu typ [integr. omez.], jm_atributu typ [integr. omez.], ); integritní omezení lze dodefinovat později Definice
Operátory ROLLUP a CUBE
Operátory ROLLUP a CUBE Dotazovací jazyky, 2009 Marek Polák Martin Chytil Osnova přednášky o Analýza dat o Agregační funkce o GROUP BY a jeho problémy o Speciální hodnotový typ ALL o Operátor CUBE o Operátor
Autorizovaný software DRUM LK 3D SOFTWARE PRO VYHODNOCENÍ MĚŘENÍ ODCHYLEK HÁZIVOSTI BUBNOVÝCH ROTAČNÍCH SOUČÁSTÍ
Autorizovaný software DRUM LK 3D SOFTWARE PRO VYHODNOCENÍ MĚŘENÍ ODCHYLEK HÁZIVOSTI BUBNOVÝCH ROTAČNÍCH SOUČÁSTÍ Ing. Michal Švantner, Ph.D. Doc. Ing. Milan Honner, Ph.D. 1/10 Anotace Popisuje se software,
X37SGS Signály a systémy
X7SGS Signály a systémy Matlab minihelp (poslední změna: 0. září 2008) 1 Základní maticové operace Vytvoření matice (vektoru) a výběr konkrétního prvku matice vytvoření matice (vektoru) oddělovač sloupců
Katedra kybernetiky, FEL, ČVUT v Praze.
Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz posnova přednášek Přednáška Učitel Obsah 1. J. Kléma Úvod do předmětu, učení s a bez učitele.
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH Viktor Haškovec, Martina Mudrová Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Abstrakt Příspěvek je věnován zpracování biomedicínských
pi Ludolfovo číslo π = 3,14159 e Eulerovo číslo e = 2,71828 (lze spočítat jako exp(1)), např. je v Octave, v MATLABu tato konstanta e není
realmax maximální použitelné reálné kladné číslo realmin minimální použitelné reálné kladné číslo (v absolutní hodnotě, tj. číslo nejblíž k nule které lze použít) 0 pi Ludolfovo číslo π = 3,14159 e Eulerovo
Bayesovská statistika. Syntax editor. Vylepšení grafiky. Přidáno ve verzi 24. IBM SPSS Statistics. IBM Software Business Analytics
IBM Software Novinky Nové nástroje a funkce pro urychlení a zjednodušení analýz Analýza dat je nástrojem k dosažení cílů organizace a plní čím dál tím důležitější úlohu v rozhodování. Software IBM SPSS