Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Podobné dokumenty
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Metody analýzy dat I. Míry a metriky - pokračování

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování

Základy informatiky. Teorie grafů. Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová

Metody analýzy dat I (Data Analysis I) Strukturální vlastnosti sítí 1. krok analýzy

Úvod do teorie grafů

Grafy. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta.

Metody analýzy dat I (Data Analysis I) Míry a metriky (Measures and Metrics) - - pokračování

Základní pojmy teorie grafů [Graph theory]

Základy informatiky. 07 Teorie grafů. Kačmařík/Szturcová/Děrgel/Rapant

Jan Březina. 7. března 2017

07 Základní pojmy teorie grafů

TGH02 - teorie grafů, základní pojmy

Teorie grafů. Teoretická informatika Tomáš Foltýnek

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Moderní aplikace statistické fyziky II - TMF050

Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.

Kostry. 9. týden. Grafy. Marie Demlová (úpravy Matěj Dostál) 16. dubna 2019

PB050: Modelování a predikce v systémové biologii

Diagnostika síťových aplikací - Zkouška

Jarníkův algoritmus. Obsah. Popis

VLASTNOSTI GRAFŮ. Vlastnosti grafů - kap. 3 TI 5 / 1

Graf. Uzly Lokality, servery Osoby fyzické i právní Informatické objekty... atd. Hrany Cesty, propojení Vztahy Informatické závislosti... atd.

GRAFY A GRAFOVÉ ALGORITMY

PROGRAMOVÁNÍ. Cílem předmětu Programování je seznámit posluchače se způsoby, jak algoritmizovat základní programátorské techniky.

Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest

Karta předmětu prezenční studium

Úvod do GIS. Prostorová data I. část. Pouze podkladová prezentace k přednáškám, nejedná se o studijní materiál pro samostatné studium.

TGH02 - teorie grafů, základní pojmy

TGH02 - teorie grafů, základní pojmy

Rastrová reprezentace

Teorie grafů. zadání úloh. letní semestr 2008/2009. Poslední aktualizace: 19. května First Prev Next Last Go Back Full Screen Close Quit

4EK311 Operační výzkum. 5. Teorie grafů

Metody síťové analýzy

Albert-László Barabási

Teorie grafů. Kostra grafu. Obsah. Radim Farana Podklady pro výuku pro akademický rok 2013/2014

ALGORITMY A DATOVÉ STRUKTURY

ORIENTOVANÉ GRAFY, REPREZENTACE GRAFŮ

4 Pojem grafu, ve zkratce

TEORIE GRAFŮ TEORIE GRAFŮ 1

Paralelní grafové algoritmy

MATEMATIKA A 3 Metodický list č. 1

Buněčné automaty a mřížkové buněčné automaty pro plyny. Larysa Ocheretna

Grafové algoritmy. Programovací techniky

Metody analýzy dat II

Grafové algoritmy. Programovací techniky

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Hledáme efektivní řešení úloh na grafu

Operační výzkum. Síťová analýza. Metoda CPM.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Multimediální systémy

Algoritmizace prostorových úloh

TGH05 - aplikace DFS, průchod do šířky

Inteligentní systémy a neuronové sítě

TGH06 - Hledání nejkratší cesty

Metody analýzy dat II

Drsná matematika III 10. demonstrovaná cvičení Kostry grafů

Matice sousednosti NG

2. přednáška z předmětu GIS1 Data a datové modely

GIS Geografické informační systémy

SAFETY IN LOGISTIC TRANSPORT CHAINS USING THEORY OF GRAPHS

IV117: Úvod do systémové biologie

řádově různě rostoucí rostou řádově stejně rychle dvě funkce faktor izomorfismus neorientovaných grafů souvislý graf souvislost komponenta

TGH08 - Optimální kostry

Teorie grafů BR Solutions - Orličky Píta (Orličky 2010) Teorie grafů / 66

Datové typy a struktury

Dynamické programování

Požadavky k písemné přijímací zkoušce z tematického okruhu 1 (Logistika)

TGH05 - aplikace DFS, průchod do šířky

TGH06 - Hledání nejkratší cesty

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

Projekt programu Inženýrská Informatika 2

MODERNÍ APLIKACE STATISTICKÉ FYZIKY I

GIS Geografické informační systémy

PROBLEMATIKA TAKTOVÝCH JÍZDNÍCH ŘÁDŮ THE PROBLEMS OF INTERVAL TIMETABLES

Multimediální systémy

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 3

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Karta předmětu prezenční studium

Informatika. tercie. Mgr. Kateřina Macová 1

Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly.

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

Jan Březina. Technical University of Liberec. 21. dubna 2015

Geografická informace GIS 1 155GIS1. Martin Landa Lena Halounová. Katedra geomatiky ČVUT v Praze, Fakulta stavební 1/23

Data Science projekty v telekomunikační společnosti

Algoritmy na ohodnoceném grafu

Neuropočítače. podnět. vnímání (senzory)

Marketingové využití internetu

Algoritmus pro hledání nejkratší cesty orientovaným grafem

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu:

POKROČILÉ POUŽITÍ DATABÁZÍ

Jan Březina. Technical University of Liberec. 30. dubna 2013

Formální konceptuální analýza

Architektury Informačních systémů. Jaroslav Žáček

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2016

Transkript:

Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)

Literatura Albert-László Barabási. Network Science http://barabasi.com/networksciencebook/ kapitoly 1 a 2 http://tuvalu.santafe.edu/~aaronc/courses/5352/csci5352_ 2017_L1.pdf Newman, M. (2010). Networks: An Introduction. Oxford University Press. [15-77] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. [93-99] Leskovec, J., Rajaraman, A., Ullman, J. D. (2014). Mining of massive datasets. Cambridge University Press. [341-346]

Co je síť? Tradiční paradigma v analýze dat předpokládá, že je každá datová instance nezávislá na jiné. Ale, často mohou být instance spojeny s jinými prostřednictvím různých typů vztahů. Jednotlivé instance mohou být popsány různými atributy. Vzniká síť instancí (uzlů), které jsou propojeny vazbami, odkazy (hranami). Jak uzly tak hrany mohou mít různé atributy (číselné nebo kategoriální, nebo složitější (např. časové řady).

Sociální sítě Sociální sítě V užším slova smyslu např. Facebook (neorient.) nebo Twitter (orient.) V širším slova smyslu kolekce entit propojených odkazy, vazbami (! existuje alespoň jeden odkaz) v mnoha případech sítě nejsou náhodné Lidé, kteří jsou přáteli Počítače, které jsou propojeny do poč. sítě Webové stránky, které se odkazují na jiné Interakce proteinů Analýza sociálních sítí (Social Network Analysis, SNA)

Terminologie Terminologie (v různých oborech) points lines discipline vertices, nodes edges, arcs math= graph theory routers links computer science sites bonds physics actors ties, relations sociology

Network Science Co je NS? NS je věda o komplexních (tj. složitých, ale i složených ) systémech reprezentovaných (typicky dynamickými) sítěmi Sociální, biologické, atd. Opírá se o: Síťová data, Síťové modely, Síťové algoritmy, Statistické vlastnosti síťových dat, Kořeny NS Graph Theory, Statistical Mechanics, Nonlinear Dynamics, Games and Learning, Data mining ( graph mining ) and machine learning, Algorithms, Complexity theory

Komplexní sítě Komplexní systém: sbírka interagujících prvků projevujících globální dynamiku, která vyplývá z činnosti (chování) jeho částí bez organizovaného centralizovaného řízení. Complex networks - networks whose structure is irregular, complex and dynamically evolving in time. Wikipedie: In the context of network theory, a complex network is a graph (network) with non-trivial topological features features that do not occur in simple networks such as lattices or random graphs but often occur in real graphs.

Aplikace NS Social networks and social media Economic networks Biology Ecology Network medicine Climate science Brain Science and Neuroscience Web Internet and computer networks Scientometrics..

Proč se zabývat sítěmi? Jsou všude kolem nás Čím dál tím více systémů lze modelovat sítěmi Chceme: Porozumět jejich topologii, Měřit jejich vlastnosti, Studovat jejich chování (vývoj, dynamiku změn), Vytvářet realistické modely, Vytvářet užitečné algoritmy, Stávající sítě ale rostou Problém s velikostí sítí Máme výpočetní prostředky pro jejich studium Úkolem je ale vyvinout nástroje pro práci s rozsáhlými sítěmi

Typy sítí Sítě Sociální Informační Biologické Technologické

Sociální sítě Linky znamenají sociální vazby Sítě známostí Newman: The structure and function of complex networks, 18th page

Romantic relations in highschool

Jiné sociální sítě E-mailové sítě Sítě spolupráce Sítě autorů, resp. spoluautorů Herecké sítě http://www.fas-research.com/gallery10.shtml/

Email exchanges in a company

Socio-epidemic networks

Informační (znalostní) sítě Entity představují informace, odkazy (linky) sdružují (spojují) informace Citační sítě The World Wide Web

Technologické sítě Sítě vybudované pro účely distribuce určité komodity Internet Sítě aerolinií Telefonní sítě Transportní sítě Silniční, železniční, energetické

US highway network

Airline network

PoP-level Internet2 network

Biologické sítě Interakce protein-protein Potravinové sítě (řetězce) Uzly živočišné druhy Linky druh živící se jiným druhem http://many.corante.com/archives/2004/02/

Metabolic networks

Protein interaction networks

Brain networks - Structural vs Functional networks

Internet - vizualizace Komplexní sítě s biliony uzlů nelze přesně zobrazit, musíme se spokojit s vizualizací přibližné představy

Základní pojmy Opakování z Bc. předmětu Diskrétní matematika (základy Teorie grafů) Orientovaný (directed), neorientovaný (undirected) graf, hrany, vrcholy, relace incidence Smyčka (loop), izolovaný vrchol, multihrana, Stupeň (degree) Ohodnocený (weighted) graf (síť) - hranové, vrcholové, cena (váha, ohodnocení) Multigraf, prostý (simple) graf, úplný (complete) graf, bipartitní graf (2-mode graph), regulární graf, strom

Základní pojmy Sled (walk), tah (trail), cesta (path), kružnice, cyklus, úplný uzavřený s., t., c. Dostupnost (dosažitelnost) vrcholu Vzdálenost (distance) Souvislost (connectedness), souvislá komponenta (component) Algoritmy pro nejkratší cesty Kostra grafu

Metody analýzy dat I (Data Analysis I) Reprezentace sítí (grafů) (Graph Representation)

Obrázkem, nakreslením Reprezentace grafů

Matice sousednosti (adjacency matrix)

Matice incidence (incidence matrix)

matice cen matice vzdáleností

Seznamem vrcholů a jejich sousedů (a příp. i cen)

Seznamem hran (příp. i s cenami) (v5, v4)