K velkým datům přes matice a grafy

Podobné dokumenty
Počítání na soudobých počítačových architekturách - matice, grafy, sítě, ale hlavně matematika. Přednáška k poctě Miroslava Fiedlera a Alana George

Simulace (nejen) fyzikálních jevů na počítači

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček. 8. přednáška 11MSP pondělí 20. dubna 2015

IB112 Základy matematiky

U Úvod do modelování a simulace systémů

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Soustavy lineárních rovnic

Soustavy lineárních rovnic

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

Základy matematiky pro FEK

SOUSTAVY LINEÁRNÍCH ALGEBRAICKÝCH ROVNIC

Úvod do lineární algebry

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Úvod do modelování a simulace. Ing. Michal Dorda, Ph.D.

FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Soustavy linea rnı ch rovnic

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

1 Projekce a projektory

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

[1] LU rozklad A = L U

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

[1] Determinant. det A = 0 pro singulární matici, det A 0 pro regulární matici

Základní pojmy teorie množin Vektorové prostory

řešeny numericky 6 Obyčejné diferenciální rovnice řešeny numericky

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Soustavy lineárních rovnic a determinanty

APLIKACE. Poznámky Otázky

Základy matematiky pro FEK

15. listopadu Matematický ústav UK Matematicko-fyzikální fakulta. Hermitovská interpolace

Lingebraické kapitolky - Počítání s maticemi

0.1 Úvod do lineární algebry

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

3. Grafy a matice. Definice 3.2. Čtvercová matice A se nazývá rozložitelná, lze-li ji napsat ve tvaru A =

Aplikovaná numerická matematika

13. Lineární procesy

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

Budeme hledat řešení y(x) okrajové úlohy pro diferenciální rovnici druhého řádu v samoadjungovaném tvaru na intervalu a, b : 2 ) y i p i+ 1

Kapitola 12: Soustavy diferenciálních rovnic 1. řádu

(Cramerovo pravidlo, determinanty, inverzní matice)

Operace s maticemi. 19. února 2018

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

1 Determinanty a inverzní matice

Úlohy nejmenších čtverců

ekologie Pavel Fibich Vektor a Matice Operace s maticemi Vlastnosti matic Pavel Fibich Shrnutí Literatura

Matematika 1 MA1. 2 Determinant. 3 Adjungovaná matice. 4 Cramerovo pravidlo. 11. přednáška ( ) Matematika 1 1 / 29

Princip řešení soustavy rovnic

0.1 Úvod do lineární algebry

Cvičení 5 - Inverzní matice

1 Linearní prostory nad komplexními čísly

Cvičení z Numerických metod I - 12.týden

7. Důležité pojmy ve vektorových prostorech

1/10. Kapitola 12: Soustavy lineárních algebraických rovnic

4EK213 LINEÁRNÍ MODELY

Numerické metody a programování. Lekce 4

Všechno, co jste kdy chtěli vědět o maticích, ale báli jste se zeptat

Cvičení z Lineární algebry 1

13. Lineární programování

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

Rovinná úloha v MKP. (mohou být i jejich derivace!): rovinná napjatost a r. deformace (stěny,... ): u, v. prostorové úlohy: u, v, w

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Aplikovaná numerická matematika - ANM

Markovské metody pro modelování pravděpodobnosti

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

DRN: Soustavy linárních rovnic numericky, norma

Interpolace, ortogonální polynomy, Gaussova kvadratura

6. Lineární nezávislost a báze p. 1/18

Numerická matematika 1

x 2 = a 2 + tv 2 tedy (a 1, a 2 ) T + [(v 1, v 2 )] T A + V Příklad. U = R n neprázdná množina řešení soustavy Ax = b.

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava luk76/la1

ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY. Michal Friesl

Soustavy. Terminologie. Dva pohledy na soustavu lin. rovnic. Definice: Necht A = (a i,j ) R m,n je matice, b R m,1 je jednosloupcová.

Jedná se o soustavy ve tvaru A X = B, kde A je daná matice typu m n,

Tento dokument obsahuje zadání pro semestrální programy z PAA. Vypracování. vypracovanou úlohu podle níže uvedených zadání. To mimo jiné znamená, že

Vlastní číslo, vektor

ANTAGONISTICKE HRY 172

AVDAT Vektory a matice

VĚTY Z LINEÁRNÍ ALGEBRY

Matematika I Lineární závislost a nezávislost

[1] Motivace. p = {t u ; t R}, A(p) = {A(t u ); t R} = {t A( u ); t R}

Matematika 1 MA1. 1 Analytická geometrie v prostoru - základní pojmy. 4 Vzdálenosti. 12. přednáška ( ) Matematika 1 1 / 32

Změna koeficientů PDR při změně proměnných

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

4EK213 Lineární modely. 10. Celočíselné programování

SOUSTAVY LINEÁRNÍCH ROVNIC

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Voronoiův diagram. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta

A6M33SSL: Statistika a spolehlivost v lékařství Teorie spolehlivosti

Numerické řešení nelineárních rovnic

2. Schurova věta. Petr Tichý. 3. října 2012

Operace s maticemi

Slovo ALGEBRA pochází z arabského al-jabr, což znamená nahrazení. Toto slovo se objevilo v názvu knihy

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

7. Lineární vektorové prostory

Transkript:

K velkým datům přes matice a grafy Miroslav Tůma Katedra numerické matematiky, MFF UK mirektuma@karlin.mff.cuni.cz MFF UK, 10.4.2019 1 / 70

Outline 1 Motivace 2 Šíření infekční choroby 3 Jiné motivace 4 K algoritmickému řešení problému vlastních čísel 5 Rozděl a spojuj 6 Přemítání o problému 7 Dělení grafů na části 8 Rozděl a spojuj 9 Závěr 2 / 70

Motivace Značná část viditelného makrosvěta se dá popsat Spojitými zákony pro fyzikální veličiny 2 u t 2 = 2 u c2 x 2 Toto je například rovnice šíření elektromagnetických vln v jedné dimenzi Aby se takový vztah dal zpracovávat v počítači, musí se převést na diskrétní diskretizovat Tedy převést na matice, vektory,... A, b, v,... Nebo přímo diskrétními strukturami Jenže co pak s těmi diskrétními strukturami dál... 3 / 70

Motivace Tato přednáška ukáže problémy, které s těmi diskrétními strukturami máme a kde hledat matematickou pomoc Příklad šíření infekční choroby násobení maticí problém vlastních čísel Použitelné matematické techniky v pozadí řešení soustav lineárních rovnic eliminace 4 / 70

Outline 1 Motivace 2 Šíření infekční choroby 3 Jiné motivace 4 K algoritmickému řešení problému vlastních čísel 5 Rozděl a spojuj 6 Přemítání o problému 7 Dělení grafů na části 8 Rozděl a spojuj 9 Závěr 5 / 70

Šíření infekční choroby ve dnech 1,...,n 6 / 70

Šíření infekční choroby ve dnech 1,...,n Den t, soubor n osob. I(t) značí procento infikovaných osob S(t) procento osob, které nebyly nikdy infikovány R(t) procento uzdravených osob: R(t)=100 I(t) S(t) (po k dnech) Ještě potřebujeme vědět parametry: Jaké procento τ lidí se v průměru od souseda nakazí, když se nemoc šíří například mezi lůžky nemocnice, to jest při daném rozložení. Složitější: Jaká část ν lidí je třebas mobilní. Model můžeme činit složitější až se dostane skoro k realitě To je tak skoro vždycky a matematika nám musí říci, co to je skoro k realitě. 7 / 70

Šíření infekční choroby ve dnech 1,...,n Jak na to? Například simulací. Simulace má prvek náhodnosti: Nějaké procento sousedů onemocní, ale není jasné kteří to budou. Simulace se musí nechat probíhat víckrát a pak výsledky zprůměrovat. Říkáme tomu, že model je stochastický. Nejjednodušší situace: předpoklad o rozmístění 8 / 70

Šíření infekční choroby ve dnech 1,...,n Nejjednodušší simulace 10 10 postelí v nemocnici, k= 2, τ= 0.2 (nakažlivost) Ten prostřední to chytne nejdřív a šíří a šíří... 1 0.9 0.8 Disease Status with tau = 0.200000 Infected Susceptible Recovered Proportion of individuals 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 day 9 / 70

Šíření infekční choroby ve dnech 1,...,n Simulace s mobilitou δ = 0.01 1 0.9 0.8 Disease Status with tau = 0.200000, delta = 0.010000 Infected Susceptible Recovered Proportion of individuals 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 day 10 / 70

Šíření infekční choroby ve dnech 1,...,n Simulace s přidaným očkováním s pravděpodobností 10% Disease Status with tau = 0.200000, delta = 0.010000, nu= 0.100000 1 0.9 0.8 Infected Susceptible Recovered Vaccinated Proportion of individuals 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 14 16 day 11 / 70

Šíření infekční choroby ve dnech 1,...,n Co je za simulací? Model v simulaci má takzvanou Markovskou vlastnost: Označme si stav každého vrcholu (postele) 1,..., p pomocí p-tice (d 1, d 2,..., d p ) očkovaný, di = 2 vyléčený, di = 1 ohrožený (ještě nemoc neprodělal), di = 0 infikovaný j-tý den, di = j, j k hrany mezi sousedy 12 / 70

Šíření infekční choroby ve dnech 1,...,n Model v pozadí je matice pravděpodobností přechodů mezi jednotlivými stavy. A=(a ij ), a ij je pravděpodobnost přechodu ze stavu i do stavu j, součty ve sloupcích jsou 1. Začneme-li v prvním dnu, pak Ae 1 jsou pravděpodobnosti pro druhý den, A 2 e 1 jsou pravděpodobnosti pro třetí den atd. Jak najdeme cílový stav, třebas i pro komplikovanější model? Chceme, aby platilo pro nějaké rozložení Az= z. To je ale řešení problému vlastních čísel Ax=λx, λ=1. 13 / 70

Outline 1 Motivace 2 Šíření infekční choroby 3 Jiné motivace 4 K algoritmickému řešení problému vlastních čísel 5 Rozděl a spojuj 6 Přemítání o problému 7 Dělení grafů na části 8 Rozděl a spojuj 9 Závěr 14 / 70

Jiné motivace Za šířením byla nějaká struktura, ale ta může být složitější Rozšíření komára 15 / 70

Jiné motivace Za šířením byla nějaká struktura, ale ta může být složitější Teplotní extrémy 16 / 70

Jiné motivace Za šířením byla nějaká struktura, ale ta může být složitější Elektrická síť 17 / 70

Jiné motivace Za šířením byla nějaká struktura, ale ta může být složitější Genealogická informace 18 / 70

Outline 1 Motivace 2 Šíření infekční choroby 3 Jiné motivace 4 K algoritmickému řešení problému vlastních čísel 5 Rozděl a spojuj 6 Přemítání o problému 7 Dělení grafů na části 8 Rozděl a spojuj 9 Závěr 19 / 70

K řešení problému Jak vypadají naše problémy a jak se s nimi vyrovnáme? Především, struktura matice může být obrovská a nepřehledná 0 100 200 300 400 500 600 700 800 0 200 400 600 800 nz = 17070 Spousta nul: říkáme, že matice je řídká Dimenze klidně až milióny, miliardy Takovou strukturu můžeme reprezentovat grafem. Co s takovým grafem budeme dělat? 20 / 70

Řešíme problém 1. Potřebujeme matici rozložit (eliminovat nenuly) uspořádání matice, aby nám vzniklo co nejméně nenulových prvků rozkladu 2. Potřebujeme se vyrovnat s moderními počítačovými architekturami rozdělení grafu (a práce) mezi více procesorů/jader 21 / 70

Řešíme problém: 2. CPU CPU CPU CPU Memory Memory Memory Memory Interconnection Ale jak rozdělíme graf, kde není na první pohled vidět jak? Spousta technik a stále nové ve vývoji. 22 / 70

Řešíme problém: 2. Jak rozdělit například tenhle graf? 23 / 70

Řešíme problém: 2. A jak rozdělit tenhle graf? 24 / 70

Řešíme problém: 2. A jak rozdělit tenhle graf? 25 / 70

Řešíme problém: 2. A jak rozdělit tenhle graf? 26 / 70

Outline 1 Motivace 2 Šíření infekční choroby 3 Jiné motivace 4 K algoritmickému řešení problému vlastních čísel 5 Rozděl a spojuj 6 Přemítání o problému 7 Dělení grafů na části 8 Rozděl a spojuj 9 Závěr 27 / 70

Rozděl a spojuj Druhý, ale i první problém můžeme řešit následovně. C_1 C_2 28 / 70

Rozděl a spojuj Matice po jednom dělení C_1 C_2 S C_1 C_2 S 29 / 70

Rozděl a spojuj Rozdělit můžeme víckrát - rekurzívně 1 7 4 43 22 28 25 3 8 6 44 24 29 27 2 9 5 45 23 30 36 19 20 21 46 40 41 42 10 16 13 47 31 37 34 12 17 15 48 33 38 36 11 18 14 49 32 39 35 30 / 70

Rozděl a spojuj Dělíme vícekrát: krásňoučká pravidelná matice 0 20 40 60 80 100 120 140 160 0 20 40 60 80 100 120 140 160 nz = 793 31 / 70

Závěr Řada problémů praxe vede k diskrétním úlohám, které mají pod sebou strukturu vztahů / strukturu grafu Například naše úloha šíření infekční nemoci Řešení výsledných problémů vede k maticím, vektorům řadě zajímavých úloh mezi trojlístkem Řídká matice Problém vlastních čísel a řešení soustav lineárních rovnic Vlastnosti počítačové architektury. 32 / 70