Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)



Podobné dokumenty
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I. Míry a metriky - pokračování

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování

Základy informatiky. Teorie grafů. Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová

Metody analýzy dat I (Data Analysis I) Strukturální vlastnosti sítí 1. krok analýzy

Metody analýzy dat I (Data Analysis I) Míry a metriky (Measures and Metrics) - - pokračování

Jan Březina. 7. března 2017

Grafy. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta.

Úvod do teorie grafů

Základní pojmy teorie grafů [Graph theory]

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Moderní aplikace statistické fyziky II - TMF050

Základy informatiky. 07 Teorie grafů. Kačmařík/Szturcová/Děrgel/Rapant

07 Základní pojmy teorie grafů

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

TGH02 - teorie grafů, základní pojmy

Teorie grafů. Teoretická informatika Tomáš Foltýnek

Úvod do GIS. Prostorová data I. část. Pouze podkladová prezentace k přednáškám, nejedná se o studijní materiál pro samostatné studium.

Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.

Diagnostika síťových aplikací - Zkouška

PROGRAMOVÁNÍ. Cílem předmětu Programování je seznámit posluchače se způsoby, jak algoritmizovat základní programátorské techniky.

Rastrová reprezentace

Jarníkův algoritmus. Obsah. Popis

2. přednáška z předmětu GIS1 Data a datové modely

PB050: Modelování a predikce v systémové biologii

Graf. Uzly Lokality, servery Osoby fyzické i právní Informatické objekty... atd. Hrany Cesty, propojení Vztahy Informatické závislosti... atd.

Karta předmětu prezenční studium

VLASTNOSTI GRAFŮ. Vlastnosti grafů - kap. 3 TI 5 / 1

Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest

GRAFY A GRAFOVÉ ALGORITMY

Kostry. 9. týden. Grafy. Marie Demlová (úpravy Matěj Dostál) 16. dubna 2019

GIS Geografické informační systémy

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

TGH06 - Hledání nejkratší cesty

Metody analýzy dat II

Buněčné automaty a mřížkové buněčné automaty pro plyny. Larysa Ocheretna

GIS Geografické informační systémy

TGH02 - teorie grafů, základní pojmy

Karta předmětu prezenční studium

ORIENTOVANÉ GRAFY, REPREZENTACE GRAFŮ

Inteligentní systémy a neuronové sítě

ALGORITMY A DATOVÉ STRUKTURY

Dynamické programování

Albert-László Barabási

Teorie grafů. zadání úloh. letní semestr 2008/2009. Poslední aktualizace: 19. května First Prev Next Last Go Back Full Screen Close Quit

TGH02 - teorie grafů, základní pojmy

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Matice sousednosti NG

Multimediální systémy

4 Pojem grafu, ve zkratce

Grafové algoritmy. Programovací techniky

Grafové algoritmy. Programovací techniky

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

řádově různě rostoucí rostou řádově stejně rychle dvě funkce faktor izomorfismus neorientovaných grafů souvislý graf souvislost komponenta

Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly.

Jan Březina. Technical University of Liberec. 21. dubna 2015

Datové typy a struktury

TGH06 - Hledání nejkratší cesty

Marketingové využití internetu

SAFETY IN LOGISTIC TRANSPORT CHAINS USING THEORY OF GRAPHS

Metody analýzy dat II

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 3

Problémy třídy Pa N P, převody problémů

Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu:

POKROČILÉ POUŽITÍ DATABÁZÍ

Jan Březina. Technical University of Liberec. 30. dubna 2013

TEORIE GRAFŮ TEORIE GRAFŮ 1

Formální konceptuální analýza

Architektury Informačních systémů. Jaroslav Žáček

Paralelní grafové algoritmy

MBI - technologická realizace modelu

Hledáme efektivní řešení úloh na grafu

Informatika. tercie. Mgr. Kateřina Macová 1

Geografická informace GIS 1 155GIS1. Martin Landa Lena Halounová. Katedra geomatiky ČVUT v Praze, Fakulta stavební 1/23

Metody síťové analýzy

TGH05 - aplikace DFS, průchod do šířky

Algoritmizace prostorových úloh

Data Science projekty v telekomunikační společnosti

Architektury Informačních systémů. Jaroslav Žáček

Multimediální systémy

Neuropočítače. podnět. vnímání (senzory)

IV117: Úvod do systémové biologie

Teorie grafů BR Solutions - Orličky Píta (Orličky 2010) Teorie grafů / 66

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Algoritmus pro hledání nejkratší cesty orientovaným grafem

Projektové řízení. Lenka Švecová, Tomáš Říčka. University of Economics, Prague. Project management for SMEs/NGOs - exchange of experience for trainers

PostGIS Topology. Topologická správa vektorových dat v geodatabázi PostGIS. Martin Landa

PROBLEMATIKA TAKTOVÝCH JÍZDNÍCH ŘÁDŮ THE PROBLEMS OF INTERVAL TIMETABLES

Suffixové stromy. Osnova:

Úvod do mobilní robotiky AIL028

Geoinformatika. I Geoinformatika a historie GIS

5 Orientované grafy, Toky v sítích

TGH08 - Optimální kostry

Projekt programu Inženýrská Informatika 2

Moderní systémy pro získávání znalostí z informací a dat

Kartografické modelování V Topologické překrytí - Overlay

Strojové učení Marta Vomlelová

Transkript:

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Literatura Newman, M. (2010). Networks: An Introduction. Oxford University Press. [15-77] Leskovec, J., Rajaraman, A., Ullman, J. D. (2014). Mining of massive datasets. Cambridge University Press. [341-346]

Co je síť? Tradiční paradigma v analýze dat předpokládá, že je každá datová instance nezávislá na jiné (viz nezávislost jevů). Ale, často mohou být instance spojeny s jinými prostřednictvím různých typů vztahů. Jednotlivé instance mohou být popsány různými atributy. Vzniká tak síť (nebo graf) instancí (vrcholů), které jsou propojeny odkazy (hranami). Jak uzly tak hrany mohou mít různé atributy (číselné nebo kategoriální, nebo dokonce složitější (např. časové řady).

Sociální sítě Analýza sociálních dat (Social Network Analysis, SNA) Sociální sítě V užším slova smyslu např. Facebook (neorient.) nebo Twitter (orient.) V širším slova smyslu kolekce entit propojených odkazy (existuje alespoň jeden odkaz) v mnoha případech sítě nejsou náhodné Lidé, kteří jsou přáteli Počítače, které jsou propojeny do poč. sítě Webové stránky, které se odkazují na jiné Interakce proteinů

Terminologie Terminologie (v různých oborech) points lines discipline vertices, nodes edges, arcs math= graph theory routers links computer science sites bonds physics actors ties, relations sociology

Network Science SNA, NS Co je NS? NS je věda o komplexních (tj. složitých, ale i složených ) systémech reprezentovaných (typicky dynamickými) sítěmi Sociální, biologické, atd. Opírá se o: Síťová data Síťové modely Síťové algoritmy Statistické vlastnosti síťových dat

Komplexní sítě Komplexní systém: sbírka interagujících prvků projevujících globální dynamiku, která vyplývá z činnosti (chování) jeho částí bez organizovaného centralizovaného řízení. Complex networks - networks whose structure is irregular, complex and dynamically evolving in time. Wikipedie: In the context of network theory, a complex network is a graph (network) with non-trivial topological features features that do not occur in simple networks such as lattices or random graphs but often occur in real graphs.

Kořeny NS Graph Theory Statistical Mechanics Nonlinear Dynamics Games and Learning Data mining ( graph mining ) and machine learning Algorithms Complexity theory

Aplikace NS Social networks and social media Economic networks Biology Ecology Network medicine Climate science Brain Science and Neuroscience Web Internet and computer networks Scientometrics..

Proč se zabývat sítěmi? Jsou všude kolem nás Čím dál tím více systémů lze modelovat sítěmi Jejich analýza poskytuje mnoho zajímavých informací o reálném světě Stávající sítě ale rostou Problém s velikostí sítí Máme výpočetní prostředky pro jejich studium Úkolem je ale vyvinout nástroje pro práci s rozsáhlými sítěmi

Příklady sítí Sítě Sociální Informační Biologické Technologické

Sociální sítě Linky znamenají sociální vazby Sítě známostí Newman: The structure and function of complex networks, 18th page

Romantic relations in highschool

Jiné sociální sítě E-mailové sítě Sítě spolupráce Sítě autorů, resp. spoluautorů Herecké sítě http://www.fas-research.com/gallery10.shtml/

Email exchanges in a company

Phone calls in a country

Socio-epidemic networks

Informační (znalostní) sítě Entity představují informace, odkazy (linky) sdružují (spojují) informace Citační sítě The World Wide Web

Technologické sítě Sítě vybudované pro účely distribuce určité komodity Internet Sítě aerolinií Telefonní sítě Transportní sítě Silniční, železniční, energetické

US highway network

Airline network

PoP-level Internet2 network

Biologické sítě Interakce protein-protein Potravinové sítě (řetězce) Uzly živočišné druhy Linky druh živící se jiným druhem http://many.corante.com/archives/2004/02/

Metabolic networks

Protein interaction networks

Brain networks - Structural vs Functional networks

Internet - vizualizace Komplexní sítě s biliony uzlů nelze přesně zobrazit, musíme se spokojit s přibližnou vizualizací

A dál? Svět plný sítí. Co s nimi? Chceme: Porozumět jejich topologii Měřit jejich vlastnosti Studovat jejich chování (vývoj, dynamiku změn) Získávat informace o reálném světě Vytvářet realistické modely Vytvářet užitečné algoritmy

Metody analýzy dat I (Data Analysis I) Typy a reprezentace sítí (Types and Representation of Networks)

Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [109-145] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. [93-97]

Základní pojmy Orientovaný (directed), neorientovaný (undirected) graf, hrany, vrcholy, relace incidence Smyčka (loop), izolovaný vrchol, multihrana, Stupeň (degree) Ohodnocený (weighted) graf (síť) - hranové, vrcholové, cena (váha, ohodnocení) Multigraf, prostý (simple) graf, úplný (complete) graf, bipartitní graf (2-mode graph), regulární graf, strom

Základní pojmy Sled (walk), tah (trail), cesta (path), kružnice, cyklus, úplný uzavřený s., t., c. Dostupnost (dosažitelnost) vrcholu Vzdálenost (distance) 2 Souvislost (connectedness), komponenta (component) 1 3 5 4

Obrázkem, nakreslením Reprezentace grafů

Matice sousednosti (adjacency matrix)

Matice incidence (incidence matrix)

matice cen matice vzdáleností

Seznamem vrcholů a jejich sousedů (a příp. i cen)

Seznamem hran (příp. i s cenami) (v5, v4)