Big Data. Josef Šlerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, Praha



Podobné dokumenty
SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek

Co najdeš v síti? Změna konceptu relevance výsledků vyhledávání v sociálních sítích. Kateřina Hronová, ÚISK FF UK INFORUM 2011, Praha

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Data Science projekty v telekomunikační společnosti

pánská peněženka / men s wallet size: 13,5 x 11 cm pánská peněženka / men s wallet size: 15 x 9,5 cm

2. Entity, Architecture, Process

Introduction to MS Dynamics NAV

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager

Informatizace společnosti Petra Štogrová Jedličková

Ataxo Czech s.r.o.: Měření na sociálních sítích v praxi s možností spolupráce. Josef Šlerka

Introduction to Navision 4.00 Jaromír Skorkovský, MS., PhD.

Learning Technologies

Čtvrtý Pentagram The fourth Pentagram

Rozvoj dopravní infrastruktury v regionech. Efektivita mýtného systému v ČR a možnosti pro regiony Petr Polák

Copyright 2011, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 8

Cloud Computing. ekonomický pohled a trendy. J. Vrzal, verze 0.9

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

Sociální sítě jako Velký bratr. Martin Klubal AEC a.s.

Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.

Aplikace výsledků European Social Survey a Schwartzových hodnotových orientací v oblasti reklamy

Potřebujete mít vaše IS ve shodě s legislativou? Bc. Stanislava Birnerová

Jan Pilař Microsoft MCP MCTS MCSA

Údaje o stroji PWO UNITOOLS 1250T-1

Čipové karty Lekařská informatika

Sociální síť informatiků v regionech České republiky

Role a využití sociálních sítí v interním firemním prostředí. Mgr. Vladimíra Pavelková IBM Field Enablement Leader for Central and Eastern Europe

VIKBA32 Informační vzdělávání. Nástroje ve službách informačního vzdělávání

UNIVERSITY OF MUMBAI RESULT OF THE REVALUATION CASES FOR EXAMINATION OF FACULTY OF ENGINEERING 1ST HALF' 2015

IBM Software Group IBM - SWG. Petr Chmelik WebSphere, IBM ČR a SR. Name Title Company IBM Corporation

SME instrument v praxi 2014

Kdo jsme Čím se zabýváme Nabídka služeb pro veřejnou správu Ověřeno v praxi u tisíce uživatelů v podnikatelské a bankovní sféře Plně využitelné u

Služba systému Galileo pro státem určené uživatele

TERMS & CONDITIONS 2019

Petr Vlk KPCS CZ. WUG Days října 2016

Bezpečnostní problémy VoIP a jejich řešení

2000s E-business. 2010s Smarter Planet. Client/Server Internet Big Data & Analytics. Global resources and process excellence

Od Czech POINTu k vnitřní integraci

SYSTÉMOVÉ INŽENÝRSTVÍ A

CZ.1.07/1.5.00/

Galileo PRS - Služba systému Galileo pro státem pověřené uživatele

místo, kde se rodí nápady

Klepnutím lze upravit styl Click to edit Master title style předlohy nadpisů.

The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into

IBM Connections pro firmy s Lotus Notes/Domino. Petr Kunc

Curriculum vitae. Veronika Kubatá

Social Media a firemní komunikace

analýzy dat v oboru Matematická biologie

(

Úvod do datového a procesního modelování pomocí CASE Erwin a BPwin

Conference capacity and set out kapacity a uspořádání sálů

Svět v pohybu. Rizika a příležitosti.

Budování architektury pomocí IAA

MAGAZINE ABOUT WOMEN THE WAY THEY REALLY ARE

Nová generace analytik mění zažité způsoby BI

FabLab inovační ekosystém

Efektivní komunikace cesta k úspěchu Modul Písemná elektronická komunikace anglický jazyk

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

VYUŽITÍ DATA DRIVEN PAGES

Digitální učební materiál

Pomáháme vám využívat vaše informace VYHLEDÁVACÍ TECHNOLOGIE PRO ON-LINE INFORMAČNÍ ZDROJE SEARCH DRIVEN INNOVATION

Drags imun. Innovations

Monitoring soc. sítí. Adam Zbiejczuk - StuNoMe UISK FF UK. Monday, October 10, 11

Acqua. ROZVODNICE PRO NÁSTĚNNOU MONTÁŽ - Acqua IP65 WALL MOUNTED ENCLOSURES IP65 - Acqua

ReDefine Midrange Storage VNX/VNXe. Václav Šindelář, EMC

MapleCloud a jeho použ ití. Vladimír Žák

Plánované a nadcházející inovace kapslových produktů / Planned and upcoming innovations of capsule products

Dynamic programming. Optimal binary search tree

Výuka softwarového inženýrství na OAMK Oulu, Finsko Software engineering course at OAMK Oulu, Finland

Sémantický web 10 let poté

Open Science: vědecká (r)evoluce

Uni- and multi-dimensional parametric tests for comparison of sample results

Uznávání předmětů ze zahraničních studijních pobytů

SoSIReČR Sociální síť informatiků v regionech České republiky, Peter Vojtáš, MFFUK

INTELIGENTNÍ DOPRAVNÍ SYSTÉM MĚSTA TRNAVA

Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant

RYBÁŘSKÉ ŘETĚZY FISHING CHAINS

Zaměstnanost v EU a nezaměstnanost mladých

a konverze na úřadech Martin Řehořek

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

IBM Connections. úvod. Petr Kunc, IBM IBM Corporation

Manažerský GIS. Martina Dohnalova 1. Smilkov 46, 2789, Heřmaničky, ČR

Fakulta humanitních studií

Database systems. Normal forms

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Integrating procurement into innovation Integrace zadávání zakázek a inovací. All rights reserved Eveneum and Conbelts.

Užití sociálních sítí v SEO

Digitální učební materiály Australská města, pracovní list

Jak řídit projektové portfolio

Komponentově orientované webové frameworky. Jiří Stránský twitter.com/jistr

CZ.1.07/1.5.00/

Doc.Ing.Otakar Smolík,CSc., MBA Senior Vice President Business Development Europe Ness Technologies, Inc. w w w. n e s s. c o m

květen 2008 profesní životopis

Svět v pohybu. Rizika a příležitosti.

Metodika pro zadání veřejné zakázky formou DESIGN & BUILD pro dopravní stavby v ČR

Horizont 2020 a program Věda se společností a pro společnost

Firemní strategie pro správu mobilních zařízení, bezpečný přístup a ochranu informací. Praha 15. dubna 2015

Využití hybridní metody vícekriteriálního rozhodování za nejistoty. Michal Koláček, Markéta Matulová

Enterprise Content Management IBM Corporation

Vytvoření pokročilé Fotogalerie v Drupalu - Views

Elektronické knihy na Univerzitě Karlově v Praze

Transkript:

Big Data Josef Šlerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, Praha

3 000 000 000 počet hledání na Googlu denně

30 000 000 000 počet zpráv a příspěvků na Facebooku měsíčně

5 000 000 000 mobilních telefonů po celém světě

140 000 000 průměrný počet zpráv poslaných denně na Twitteru

1 000 000 počet denně vygenerovných zpráv na českém Facebooku v otevřených profilech

600 dolarů cena disku na který se vejde veškerá hudba na světě v MP3

100 dolarů cena hodiny provozu klastru 10 počítačů na Amazonu

0 dolarů cena open-source softwarů, jako je Hadoop, Lucene,Cassandra, CouchDB, Elastich Search a dalších

Big (Data (Science)) buzzwords, které tu s námi dlouho zůstanou

Co jsou to Big Data? Big Data is a term applied to data sets whose size is beyond the ability of commonly used software tools to capture, manage, and process the data within a tolerable elapsed time. Big data sizes are a constantly moving target currently ranging from a few dozen terabytes to many petabytes of data in a single data set.

Co je Data Science? A data application acquires its value from the data itself, and creates more data as a result. It's not just an application with data; it's a data product. Data science enables the creation of data products.

Příklady Jaccardův index a TOEFL Google Translate ZIP klastrování

require 'zlib' require 'pp' files = Dir[ARGV[0] + '/*'] def deflate(*files) z = Zlib::Deflate.new z.deflate(files.collect { f open(f).read}.join("\\n"), Zlib::FINISH).size end pairwise = files.combination(2).collect do f1, f2 a, b = deflate(f1), deflate(f2) both = deflate(f1, f2) {:files => [f1, f2], :score => (a+b)-both} end pp pairwise.sort { a,b b[:score] <=> a[:score]}[0,20]

Změna paradigmatu data-driven vs. knowledge-drive (algorithm-driven) statistické modely vs. modelování skutečnosti Peter Norvig vs Noam Chomsky

Potřebné dovednosti Drew Conway

Big Social Data deep data vs. surface data data-driven sociální a humanitní vědy Lev Manovich: The Promises and the Challenges of Big Social Data

Případové studie prediktivní analýza pomocí velkých dat v praxi

Google a zaměstnanost

Twitter a burza

Mobily a cholera

Facebook a filmy zmínky o Inception na českém Facebooku 2010 a divácký ohlas

Facebook a filmy Harry Potter na českém Facebooku 2010 a divácký ohlas

Problémy aneb co nás brzdí u nás (podle mých omezených zkušeností)

Selhání vysokých škol Informatika - úzké obzory, staré názory, disky už jsou levné Java - cesta pro lepší ukrajinské dělníky

Potřeba přesahu Interdisciplinarita, spolupráce polytechnik a univerzit je toco dnes zoufale chybí, bez ní jsme jen lepší montovna.

Strach z experimentů Jsme příliš v zajetí sezónních prémií, placení za čas a strachu z IT bezpečnostní politiky. Neúspěch se neodpouští.

Inovace chtějí volnost Grantové projekty z MPO a podobné ve skutečnosti brzdí inovace, protože se orientují na řešení průmyslových problémů. Neřešíme myšlení out of box.

Co za to dostanete? podle analytiků McKinsey & Company a jejich BIG DATA: THE NEXT FRONTIER FOR INNOVATION,

Včasný přehled Making big data more accessible in a timely manner.

Budeme vědět s kým Segmenting populations to customize actions.

Přesnější rozhodování Replacing and supporting human decision-making with automated algorithms.

Produkty, které nejsou Innovating new business models, products, and services.

... a taky dobrý pocit něčeho nového:-)

Děkuji za pozornost. josef.slerka@ataxo.com josef.slerka@gmail.com