Fenomén Big Data Pohled technický



Podobné dokumenty
Moderní systémy pro získávání znalostí z informací a dat

Analytické metody v motorsportu

Datová věda (Data Science) akademický navazující magisterský program

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Informatika pro 2. stupeň

Umělá inteligence a rozpoznávání

Využití metod strojového učení v bioinformatice David Hoksza

Výrobní pracoviště budoucnosti

UČENÍ BEZ UČITELE. Václav Hlaváč

Operátory pro maticové operace (operace s celými maticemi) * násobení maticové Pro čísla platí: 2*2

Metody analýzy modelů. Radek Pelánek

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

PowerOPTI Řízení účinnosti tepelného cyklu

Automatizační a měřicí technika (B-AMT)

Časové a organizační vymezení

Psychologie, sociální psychologie a části oboru Člověk a svět práce. PC, dataprojektor, odborné publikace, dokumentární filmy

Rozhodovací procesy 3

Synergické efekty VaVpI projektů na VŠB-TU Ostrava

Téma doktorských prací pro rok Pavel Novotný

Emergence chování robotických agentů: neuroevoluce

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Ústav automatizace a měřicí techniky.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Neuronové sítě (11. přednáška)

Základy vědecké práce Nová studentská laboratoř

Národní informační středisko pro podporu kvality

Informace pro výběr bakalářského oboru

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

ELEKTRONICKÉ DOKUMENTACE PŘI VÝVOJI NOVÝCH

SYSTÉMY ŘÍZENÍ PODNIKU OKRUHY OTÁZEK KE ZKOUŠCE Z PŘEDMĚTU MPH_SYRP V magisterském studiu

Otázky ke státní závěrečné zkoušce

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

BA_EM Electronic Marketing. Pavel

Úvodem Dříve les než stromy 3 Operace s maticemi

Informační a komunikační technologie. Informační a komunikační technologie

Úvod a teoretický vstup do procesního řízení. Procesy Jičín, Bloky B2 B4 / B5 B7


A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h)

Biologicky inspirované výpočty. Schématické rozdělení problematiky a výuky

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Jak se matematika poučila v biologii

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Statistika. Klíčové kompetence V rámci výuky statistiky jsou naplňovány tyto klíčové kompetence: řešení problémů, komunikativní,

Metody a nástroje modelování Generation Adequacy. David Hrycej, CIIRC ČVUT

Obsah předmětu (přehled hlavních témat a jejich obsahové náplně)

OVLÁDÁNÍ RIZIKA ANALÝZA A MANAGEMENT

Analytické metody v motorsportu

Mechanika s Inventorem

Vyučovací předmět: informatika a výpočetní technika

5.1.7 Informatika a výpočetní technika. Časové, obsahové a organizační vymezení. ročník hodinová dotace

3.5.2 Členění a klasifikace kontrolních procesů Kritéria hodnocení používaná v kontrolní činnosti Specifika strategické kontroly 3.

Základy společenských věd (ZSV) Psychologie, sociální psychologie a části oboru Člověk a svět práce 1. ročník a kvinta

Mechanika s Inventorem

Matematika - Kvarta. řeší ekvivalentními úpravami rovnice s neznámou ve jmenovateli

Školení v rámci zemědělské a lesnické činnosti 2014

Efektivita III. pilíře - 3 scénáře změn. 5. zasedání Komise pro spravedlivé důchody Ministerstvo práce a sociálních věcí

Téma doktorských prací pro akademický rok 2019/2020. Pavel Novotný

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

Téma doktorských prací pro akademický rok 2018/2019. Pavel Novotný

Učící se klasifikátory obrazu v průmyslu

FLOWBOX INTEGRAČNÍ A ŘÍDÍCÍ ENERGETICKÁ PLATFORMA PETR VANĚK, FLOWBOX S.R.O.

Ing. Alena Šafrová Drášilová, Ph.D.

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Statistika. Jindřich Soukup. University of South Bohemia in České Budějovice Faculty of Fisheries and Protection of Waters, School of complex systems

analýzy dat v oboru Matematická biologie

Vzdělávací obsah předmětu matematika a její aplikace je rozdělen na čtyři tématické okruhy:

obhajoba diplomové práce

Nabídka zastavitelných ploch pro bydlení v územních plánech obcí vliv na disparity ve fyzické dostupnosti bydlení. RNDr.

Design vozu budoucnosti. Click to edit Master subtitle style. David Škaroupka

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

CHARAKTERISTIKA PŘEDMĚTU FYZIKA ( čtyřleté studium a vyšší stupeň osmiletého gymnázia)

Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering

ale taky protivný nepřítel

Ing. Alena Šafrová Drášilová

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Využití strojového učení k identifikaci protein-ligand aktivních míst

VZDĚLÁVÁNÍ PRO 21. STOLETÍ. Lukáš Herout Institut vzdělávání a poradenství ČZU, Praha

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Rozhodovací procesy 2

Úvodní přednáška. Význam a historie PIS

VZDĚLÁVÁNÍ VEDOUCÍCH ÚŘEDNÍKŮ - OBECNÁ ČÁST

OBSAH KAPITOLY PODNIKOVÍ ZÁKAZNÍCI DRUHY PODNIKOVÝCH ZÁKAZNÍKŮ SPOTŘEBITELSKÝ TRH

Příloha A: Souhlas s využitím obchodního jména GE Money bank, a.s. v diplomové práci

6.9 Pojetí vyučovacího předmětu Základy společenských věd

Aplikace při posuzování inv. projektů

Tabulace učebního plánu

Doc. PhDr. Ivana Švarcová CSc Ing. Tomáš Rain Ph.D.

Setkání interních auditorů z finanční oblasti. Nové výzvy pro interní audit Big Data a socialní sítě

coachpage.cz MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování ve vztahu ke koupi automobilu TOOLS for SUCCESS in TODAY s BUSINESS

Vliv podrobnosti definice procesu a úrovně CMM na charakteristiky procesu

Evoluční výpočetní techniky (EVT)

Okruhy ke SZZK nmgr. studium knihovnické zaměření

Projektově orientované studium. Kompetence

Obchodní akademie, Náchod, Denisovo nábřeží 673

Logika a studijní předpoklady

Globální strategie, podnikové procesy, IT strategie. Jaroslav Žáček

SMART GRID SYSTEM TECHNOLOGIE PRO ANALYTIKU A SPRÁVU ENERGETICKÝCH SÍTÍ. Představení společnosti Analyzátor sítě

Transkript:

Fenomén Big Data Pohled technický Diribet / Q-DAS Konference Homo Digitalis, 2014-10-09

Motivace Běžná situace při rozhodování: Mám více dat, než jsem schopen zpracovat Mám pocit nedostatku informací Více dat Pocit nedostatku informací Více možných rozhodnutí Zhoršená rozhodovací schopnost

Rozhodování na základě informace Rozhodovací Systém Lidský člověk, team, společnost Automatizovaný např. bezpečnostní prvek v autě, automatizovaná regulace výrobního procesu 3 skupiny problémů Absence informace v systému chybí, není k dispozici Ignorance informace je k dispozici, ale systém jí nezpracovává Chyba informace je k dispozici, systém ji zpracuje nesprávně Přidaná informace řeší jen problém typu Absence Intuitivní odhad, že informace se nachází ve velkém množství dat

Zdroje dat Big Data Informace o počasí rostoucí počet čidel a rostoucí vzorkovací frekvence Velký hadronový urychlovač (LHC): 150 000 000 čidel při 40 000 000 Hz Informace o spotřebitelském chování, telefonní sítě, sociální sítě Výrobní stroj, automobil, domácí spotřebič Virtuální simulace

Kde začínají Big Data? Definice Nejednotná, vágní definice Obecně: Množství dat je větší, než je možné efektivně zpracovat Objektivní rozvoj kompetencí ke zpracování velkého množství dat Vývoj nových technik, výkonného hardware, posun poznání Big Data jako slogan Vychází vstříc (nedůvodné) poptávce po množství metrik Populární (marketingové) zaříkávadlo

Analytický stroj Augusta Ada King, hraběnka z Lovelace Článek o Babbageově analytickém stroji (1843) První programátor(ka) Konceptuální přerod z počítacího stroje na analytický stroj, který umí řešit problém jakékoliv komplexnosti Poetická věda : Rozvíjela hypotézy a kladla si otázky o tom, jak se jednotlivci a společnost vztahují k výpočetní technice jako nástroji pro spolupráci

Velká čísla = 2 1000

Taková normální optimalizační úloha Stroj (auto, bagr, frézka) 400 parametrů, každý jen 2 možnosti (min, max) Například kontrola tolerančního řetězce Počet elementárních částic ve vesmíru Každá částice provede výpočtů za vteřinu (Tera Herz) Výpočetní čas = 2 400 10 85 10 12 Hz 600 tisíc krát stáří vesmíru

Technologie s Big Data - příklady Data Mining (Information Mining) Vyhledávání schémat/vzorů ve velkých souborech dat (anomálie, shluky, klasifikace, regrese,...) informace o (dříve) neznámých vlastnostech dat Strojové učení Program se mění podle dat Predikce na základě poznaných vlastností Umělá inteligence, optimalizace Učitel versus dříví v lese Tvorba předsudků, předporozumění

Technologie s Big Data - příklady Multilinear subspace learning nízkodimenzionální reprezentace vysokodimenzionálního tenzoru Problém inicializace, Lokální optimum mechanický příklad: Tenzometr Statistický strojní překlad (1949, 1980) E.g. Google Translate Statistický model na textovém korpusu Nepředvídatelný výsledek Genetické algoritmy Heuristické algoritmy mimikující přirozený výběr Problém nulté populace, evoluce nemá předvídavost

Technologie pro zpracování Big Data Vizualizace Florence Nightingale 1850 Charles Minard (6D) 1866

Florence Nightingale Klínový diagram

Charles Minard Vizualizace Big Data Svět potřebuje moudré inspektory silnic a mostů v důchodu!

Aplikační příklad Best Fit v metrologii Scan bodů na povrchu měřeného objektu Porovnání s CAD modelem Výhody Není třeba stavět program měření Není třeba metrologická kompetence Intuitivní přečtení výsledku Rychlé a atraktivní předvedení Nevýhody Všechny body mají stejnou váhu Chybí informace o funkčních rozměrech Neodpovídá na otázku je díl v toleranci?

Aplikační příklad Best Fit v metrologii Na každou komplikovanou otázku existuje nejméně jedna jednoduchá, srozumitelná, nesprávná odpověď

Informace versus Kompetence Informaci lze vnímat jen skrze kompetenci Kompetence k podstatě problému Technická, sociologická, medicínská,... Čím vyšší je odborná kompetence, tím vyšší je užitek z dat a jejich analýzy Kompetenci nelze nahradit daty / informacemi Karl Pearson parafráze: Statistika je gramatikou technické kompetence

Statistické a matematické metody Pozoruhodné vlastnosti: Metoda není nástroj Ostrá logika Ryzí abstraktnost Výstup je v jasném a logickém vztahu ke vstupu It is not box of chocolates, we know what we re gonna get Metody dávají smysl samy sobě, nevztahují se k žádnému reálnému problému. Praktická náplň přichází jen aplikací Aplikace Praktický problém Statistický problém Úskalí: Aplikace Je technický problém správně přeložen do statistického? Je statistický výsledek relevantní k technickému problému? Je logické pozadí metody ve vztahu k technickým/fyzikálním vlastnostem? Vede řešení k závěru? Může být závěr ověřen jinou metodou? Čas do poruchy výrobku A a B je zamlžen nejistotou Je životnost B alespoň tak dobrá jako A? Nejasná logika Praktický závěr Životnost B je nejméně taková, jako životnost A. Aplikace H0: Výběr z B je podřadný výběru z A H1: Výběr z B je nepodřadný výběru z A Známá logika Statistický výsledek H0 zamítnuta na úrovni α.

Interakce Informace a jejího okolí Vlastnosti okolí mají vliv na vnímání informace Odbornost, profesní kontext, kulturní kontext Informace a její forma má vliv na vlastnosti okolí Rychlá dostupnost informace umožní věnovat čas její interpretaci Snadná dostupnost informace negativně ovlivní krátkodobou pamět Porušená krátkodobá pamět zabraňuje učení / tvorbě kompetence

Závěry, teze Metody pro zpracování Big Data přináší (nové) příležitosti pro získání informací Nové technologie umožňují komplexnější analýzy a nové způsoby prezentace jejich výsledku Neexistuje záruka, že v datech je (potřebná) informace obsažena Neexistuje záruka, že příležitost bude využita Každé použití statistiky je z podstaty doprovozeno ztrátou informace, tím spíše při velké destilaci z velkých dat Člověku je třeba poskytnout takový výstup (a průběh) analýzy, aby Byl srozumitelný, odpovídající oprávněně očekávané kompetenci Mohl zapojit kritický pohled na výsledek a proces jeho vzniku Mohl informaci vnímat v jejím kontextu Vznik a použití informace bylo efektivní (výsledek, čas, peníze)