Moderní metody modelování ve fyzice jaro 2015 přednáša: D. Hemzal cvičení: F. Münz F1400 Programování F5330 Záladní numericé metody F7270 Matematicé metody zpracování měření F6180 Úvod do nelineární dynamiy F6150 Poročilé numericé metody FX003 Plánování a vyhodnocování experimentu F7780 Nelineární vlny a solitony F8370 Moderní metody modelování ve fyzice F8380 Zálady moleulového modelování a bioinformatiy strána předmětu: za http://www.physics.muni.cz/~hemzal/vyua/vyua.shtml
Obsah metoda onečných prvů (FEM), 7 týdnů MKD (vedení tepla), problémy s vlastními hodnotami (Schrödingerova rovnice) 1D-3D formulace MKP: slabá formulace ODE, tvarové funce, momentové integrály, orajové podmíny (částice v potenciálové jámě, vlnová rovnice) FDTD (Maxwellovy rovnice) neuronové sítě, 2 týdny perceptron, učení zpětným šířením chyby (fitování spetrálních profilů) Hopfieldova síť, samoorganizující se mapy (Kohonen) geneticé algoritmy, 2 týdny genotyp, selece, řížení mutace, hvězdičová schemata disrétní transformace, 2 týdny DFT, vlnová transformace RCWA pro výpočet Maxwellových rovnic soft algo orithms hands on tutorial: paralelní výpočetní architetura CUDA (optional) ab initio výpočty abinit/gaussian nebo přednáša: výlad jednotlivých metod s apliací na typicé úlohy, techniy ontroly výpočtu cvičení: používání (volně šiřitelných) programových balíů (gmsh, superlu, petsc, slepc, redsvd) podmíny uzavření předmětu ativní účast na cvičení (maximálně 3 neomluvené neúčasti) samostatně vyhotovená simulace jedné z úloh: -ohřev vzoru při laserové excitaci (Řiháče) - šíření světla v prostředí s proměnným indexem lomu (Zuzaňáová) -vypařování apy (Oleště, Koca) povinné milníy: sestavení rovnic: 5.týden disretizace úlohy: 10. týden řešení problému: 15. týden - simulace Diracovsého vodíového atomu (Gono) -Džato?, Prudil? součástí odevzdání úlohy je rátý přehledový protool, terý bude vyvěšen na stránách předmětu
reprezentace reálného čísla v počítači IEEE 754 single precision - 4 bajty bity: 31 30 23 22 0 znaméno exponent mantisa přesnost zápisu: lepší než 7 decimálních cifer double precision - 8 bajtů bity: 63 62 52 51 0 znaméno exponent mantisa přesnost zápisu: téměř 16 decimálních cifer quadruple precision spolehlivé řešení: multiple precission arithmetic násobení velých čísel rozdělit čísla na menší části (zapsané v bázi ) a násobit odděleně obětuje se počet součinů za zísání libovolné přesnosti (exponenty nehrají roli, mantisy lze vyjádřit jao celá čísla se zvoleným počtem míst) myšlena Karatsubova postupu x = x y = y xy = x 1 2 q + x 1q + K+ x2q + x1q + x0 1 2 q + y 1q + K+ y2q + y1q + y0 q 2 1 2 ( x 1 y + x y 1 ) q + K+ ( x2 y0 + x1 y1 + x0 y2 ) q + ( x1 y0 + x0 y1 ) q x0 y0 2 yq + + přílad: 1234 * 5678 = (0*10000+12*100 +34)(0*10000+56*100+78) = (12*56)10000+(78*12+34*56)100+34*78 čísla jsou v tomto typu aritmetiy (multiple precission) celou dobu uloženy ve formě rozladů a jsou definována pravidla pro operaci s těmito rozlady výhodou je možnost reurze Karatsuba přidal ještě optimalizaci počtu součinů onečná optimalizace: algoritmus Tooma-Cooa (řádu m,n)
nic nového pod Sluncem: Differential engine Charlese Babbage, cca 1820 x p[n] p 1 =p[n+1]-p[n] p 1 [n+1]-p 1 [n] 0 2-1 4 1 1 4 2 4 3 4 původní stroj: osm sloupců po jedenatřiceti cifrách složitý systém přenášení informací z nejvyšších bitů odečítání realizováno jao příčítání záporného čísla po onstruci v 1991 podle původních plánů plně funční nic nového pod Sluncem: Differential engine Charlese Babbage, cca 1820 x p[n] p 1 =p[n+1]-p[n] p 1 [n+1]-p 1 [n] 0 2-1 4 1 1 3 4 2 4 4 3 4 původní stroj: osm sloupců po jedenatřiceti cifrách složitý systém přenášení informací z nejvyšších bitů odečítání realizováno jao příčítání záporného čísla po onstruci v 1991 podle původních plánů plně funční
nic nového pod Sluncem: Differential engine Charlese Babbage, cca 1820 x p[n] p 1 =p[n+1]-p[n] p 1 [n+1]-p 1 [n] 0 2-1 4 1 1 3 4 2 4 7 4 3 11 4 původní stroj: osm sloupců po jedenatřiceti cifrách složitý systém přenášení informací z nejvyšších bitů odečítání realizováno jao příčítání záporného čísla po onstruci v 1991 podle původních plánů plně funční přesnost výpočtu náročnost výpočtu pro jednoduchost bereme součin a součet jao jednotu trvání : 1 FLOP přesnost výpočtu: ULP unit in a last place přílad: rozhraní CUDA pro výpočetní graficé arty NVIDIA nvidia Common Runtime Component operace chyba [ULP] rozsah trvání FLOP x+y, x*y 0.5 celý 4 1 1/x 1 celý 36 9 sqrtf(x) 3 celý 32 8 errff(x) 4 celý?? sinf(x) 2-48039.. 48039 x >10 7 32 8 signálové procesory