Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Podobné dokumenty
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I. Míry a metriky - pokračování

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování

Metody analýzy dat I (Data Analysis I) Strukturální vlastnosti sítí 1. krok analýzy

Základy informatiky. Teorie grafů. Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová

Metody analýzy dat I (Data Analysis I) Míry a metriky (Measures and Metrics) - - pokračování

Úvod do teorie grafů

Moderní aplikace statistické fyziky II - TMF050

Grafy. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta.

Základní pojmy teorie grafů [Graph theory]

Jan Březina. 7. března 2017

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Úvod do GIS. Prostorová data I. část. Pouze podkladová prezentace k přednáškám, nejedná se o studijní materiál pro samostatné studium.

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

07 Základní pojmy teorie grafů

TGH02 - teorie grafů, základní pojmy

Základy informatiky. 07 Teorie grafů. Kačmařík/Szturcová/Děrgel/Rapant

Diagnostika síťových aplikací - Zkouška

Karta předmětu prezenční studium

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

Teorie grafů. Teoretická informatika Tomáš Foltýnek

Buněčné automaty a mřížkové buněčné automaty pro plyny. Larysa Ocheretna

VLASTNOSTI GRAFŮ. Vlastnosti grafů - kap. 3 TI 5 / 1

2. přednáška z předmětu GIS1 Data a datové modely

PB050: Modelování a predikce v systémové biologii

Inteligentní systémy a neuronové sítě

Albert-László Barabási

Rastrová reprezentace

Kostry. 9. týden. Grafy. Marie Demlová (úpravy Matěj Dostál) 16. dubna 2019

Karta předmětu prezenční studium

Multimediální systémy

Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.

Dynamické programování

Datové typy a struktury

Marketingové využití internetu

Neuropočítače. podnět. vnímání (senzory)

SAFETY IN LOGISTIC TRANSPORT CHAINS USING THEORY OF GRAPHS

Metody analýzy dat II

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu:

POKROČILÉ POUŽITÍ DATABÁZÍ

Problémy třídy Pa N P, převody problémů

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Teorie grafů. zadání úloh. letní semestr 2008/2009. Poslední aktualizace: 19. května First Prev Next Last Go Back Full Screen Close Quit

PostGIS Topology. Topologická správa vektorových dat v geodatabázi PostGIS. Martin Landa

Formální konceptuální analýza

Architektury Informačních systémů. Jaroslav Žáček

CZ.1.07/1.5.00/

Hledáme efektivní řešení úloh na grafu

TGH06 - Hledání nejkratší cesty

Jarníkův algoritmus. Obsah. Popis

4 Pojem grafu, ve zkratce

Informatika. tercie. Mgr. Kateřina Macová 1

Metody síťové analýzy

Jan Březina. Technical University of Liberec. 21. dubna 2015

Data Science projekty v telekomunikační společnosti

TGH02 - teorie grafů, základní pojmy

Metody analýzy dat II

Inovace bakalářského studijního oboru Aplikovaná chemie

Architektury Informačních systémů. Jaroslav Žáček

MODERNÍ APLIKACE STATISTICKÉ FYZIKY I

Multimediální systémy

Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest

GIS Geografické informační systémy

Kolaborativní aplikace

TGH02 - teorie grafů, základní pojmy

Geoinformatika. I Geoinformatika a historie GIS

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 3

Suffixové stromy. Osnova:

Jan Březina. Technical University of Liberec. 30. dubna 2013

Úvod do mobilní robotiky AIL028

TGH08 - Optimální kostry

5 Orientované grafy, Toky v sítích

Moderní systémy pro získávání znalostí z informací a dat

Karta předmětu prezenční studium

Kartografické modelování V Topologické překrytí - Overlay

Operační výzkum. Síťová analýza. Metoda CPM.

PROGRAMOVÁNÍ. Cílem předmětu Programování je seznámit posluchače se způsoby, jak algoritmizovat základní programátorské techniky.

Paralelní grafové algoritmy

MBI - technologická realizace modelu

Dobývání znalostí z webu web mining

Binární vyhledávací stromy pokročilé partie

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Vyhledávání a orientace ve vědeckých informacích z pohledu citační analýzy

Web based dynamic modeling by means of PHP and JavaScript part II

GIS Geografické informační systémy

4EK311 Operační výzkum. 5. Teorie grafů

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

GRAFY A GRAFOVÉ ALGORITMY

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy

Profilová část maturitní zkoušky 2017/2018

TGH06 - Hledání nejkratší cesty

Využití metod strojového učení v bioinformatice David Hoksza

TGH05 - aplikace DFS, průchod do šířky

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

ORIENTOVANÉ GRAFY, REPREZENTACE GRAFŮ

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Grafové algoritmy. Programovací techniky

Transkript:

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Literatura Newman, M. (2010). Networks: An Introduction. Oxford University Press. [15-77] Leskovec, J., Rajaraman, A., Ullman, J. D. (2014). Mining of massive datasets. Cambridge University Press. [341-346]

Co je síť? Tradiční paradigma v analýze dat předpokládá, že je každá datová instance nezávislá na jiné. Ale, často mohou být instance spojeny s jinými prostřednictvím různých typů vztahů. Jednotlivé instance mohou být popsány různými atributy. Vzniká tak síť instancí, které jsou propojeny vazbami vzniká síť instancí (uzlů), které jsou propojeny odkazy (hranami). Jak uzly tak hrany mohou mít různé atributy (číselné nebo kategoriální, nebo složitější (např. časové řady).

Sociální sítě Sociální sítě V užším slova smyslu např. Facebook (neorient.) nebo Twitter (orient.) V širším slova smyslu kolekce entit propojených odkazy, vazbami (!existuje alespoň jeden odkaz) v mnoha případech sítě nejsou náhodné Lidé, kteří jsou přáteli Počítače, které jsou propojeny do poč. sítě Webové stránky, které se odkazují na jiné Interakce proteinů Analýza sociálních dat (Social Network Analysis, SNA)

Terminologie Terminologie (v různých oborech) points lines discipline vertices, nodes edges, arcs math= graph theory routers links computer science sites bonds physics actors ties, relations sociology

Network Science Co je NS? NS je věda o komplexních (tj. složitých, ale i složených ) systémech reprezentovaných (typicky dynamickými) sítěmi Sociální, biologické, atd. Opírá se o: Síťová data Síťové modely Síťové algoritmy Statistické vlastnosti síťových dat

Komplexní sítě Komplexní systém: sbírka interagujících prvků projevujících globální dynamiku, která vyplývá z činnosti (chování) jeho částí bez organizovaného centralizovaného řízení. Complex networks - networks whose structure is irregular, complex and dynamically evolving in time. Wikipedie: In the context of network theory, a complex network is a graph (network) with non-trivial topological features features that do not occur in simple networks such as lattices or random graphs but often occur in real graphs.

Kořeny NS Graph Theory Statistical Mechanics Nonlinear Dynamics Games and Learning Data mining ( graph mining ) and machine learning Algorithms Complexity theory

Aplikace NS Social networks and social media Economic networks Biology Ecology Network medicine Climate science Brain Science and Neuroscience Web Internet and computer networks Scientometrics..

Proč se zabývat sítěmi? Jsou všude kolem nás Čím dál tím více systémů lze modelovat sítěmi Jejich analýza poskytuje mnoho zajímavých informací o reálném světě Stávající sítě ale rostou Problém s velikostí sítí Máme výpočetní prostředky pro jejich studium Úkolem je ale vyvinout nástroje pro práci s rozsáhlými sítěmi

Příklady sítí Sítě Sociální Informační Biologické Technologické

Sociální sítě Linky znamenají sociální vazby Sítě známostí Newman: The structure and function of complex networks, 18th page

Romantic relations in highschool

Jiné sociální sítě E-mailové sítě Sítě spolupráce Sítě autorů, resp. spoluautorů Herecké sítě http://www.fas-research.com/gallery10.shtml/

Email exchanges in a company

Phone calls in a country

Socio-epidemic networks

Informační (znalostní) sítě Entity představují informace, odkazy (linky) sdružují (spojují) informace Citační sítě The World Wide Web

Technologické sítě Sítě vybudované pro účely distribuce určité komodity Internet Sítě aerolinií Telefonní sítě Transportní sítě Silniční, železniční, energetické

US highway network

Airline network

PoP-level Internet2 network

Biologické sítě Interakce protein-protein Potravinové sítě (řetězce) Uzly živočišné druhy Linky druh živící se jiným druhem http://many.corante.com/archives/2004/02/

Metabolic networks

Protein interaction networks

Brain networks - Structural vs Functional networks

Internet - vizualizace Komplexní sítě s biliony uzlů nelze přesně zobrazit, musíme se spokojit s přibližnou vizualizací

A dál? Svět plný sítí. Co s nimi? Chceme: Porozumět jejich topologii Měřit jejich vlastnosti Studovat jejich chování (vývoj, dynamiku změn) Vytvářet realistické modely Vytvářet užitečné algoritmy

Metody analýzy dat I (Data Analysis I) Typy a reprezentace sítí (TYPES AND REPRESENTATION OF NETWORKS)

Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [109-145] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. [93-97]

Základní pojmy Orientovaný (directed), neorientovaný (undirected) graf, hrany, vrcholy, relace incidence Smyčka (loop), izolovaný vrchol, multihrana, Stupeň (degree) Ohodnocený (weighted) graf (síť) - hranové, vrcholové, cena (váha, ohodnocení) Multigraf, prostý (simple) graf, úplný (complete) graf, bipartitní graf (2-mode graph), regulární graf, strom

Základní pojmy Sled (walk), tah (trail), cesta (path), kružnice, cyklus, úplný uzavřený s., t., c. Dostupnost (dosažitelnost) vrcholu Vzdálenost (distance) 2 Souvislost (connectedness), komponenta (component) 1 3 5 4