Molekulový počítačový experiment 1/16 též pseudoexperiment REÁLNÝ EXPERIMENT Vedení laboratorního deníku POČÍTAČOVÝ EXPERIMENT Vedení laboratorního deníku Zvol metodu (přístroj, protokol) Zvol metody (MD, MC,... ) Stavba aparatury (z částí) Stáhni/kup/napiš počítačový program, slož bloky kódu Nakup chemikálie, syntetizuj, co není ke koupi Připrav experiment Proved experiment, pozorně sleduj, co se děje Analyzuj a počítej Uklid laboratoř Stáhni silové pole, nafituj parametry, které nejsou dostupné Připrav počáteční konfiguraci ap. Spust program, sleduj časovou závislost veličin vč. kontrolních Stanov střední hodnoty (s odhady chyb) Zapiš zálohy, vymaž nepotřebné soubory
MD nebo MC? 2/16 MC a MD se často dají použít na podobné systémy MD realistické modely, složité molekuly (vazby, úhly... ) kondenzovaná fáze obecně (tekutiny, toztoky; biochemie) kinetické veličiny (difuzivita, viskozita... ) snazší paralelizace, exituje mnoho balíků MC jednoduché kvalitativní modely (mřížkové, tuhé koule apod.) zředěné systémy kritiké jevy fázové rovnováhy překonávání bariér je v MC snazší horší paralelizace, existuje málo balíků
Je to správně? 3/16 Systematické chyby: nepřesný molekulární model (silové pole) zanedbání kvantových jevů, nepárových sil (např. polarizovatelnosti) malý vzorek (finite-size effects) nedostatečná časová škála (dlouhé korelace, hrdlo láhve ) nevhodná metodologie: chyby integrace (příliš dlouhý krok), nedostatečně zrovnovážněno, nepřesné Coulombovy síly... Náhodné (statistické) chyby jsou principiální pro stochastické metody časově korelované lze zmenšit delším výpočtem Nejistota (v metrologii) zahrnuje kritické posouzení systematických i náhodných chyb Názvosloví kolísá podle oboru (matematická statistika, fyzika, metrologie...)
Metodika simulace [sleep 3;simul/spce.sh] 4/16 Start simulace (počáteční konfigurace): experimentální struktura (biomolekuly) krystal kapalina, plyn kapalina; Packmol náhodná konfigurace (překryvy molekul = problém v MD) problém u špatně definovaných modelů (TIP4P aj.) mřížkové modely: krystal/chaos MD: rychlosti = Maxwell-Boltzmann (stačí přibližně) Zrovnovážňování: sledovat časový (konvergenční) profil Měření veličin vč. odhadu statistických chyb
Okrajové podmínky 5/16 volné (vakuové) kapka, protein ve vakuu aj. periodické (cyklické, toroidální) B D C A pevné stěny (tuhé, měkké, z atomů, zprůměrované), póry, vrstva (slab),... E
Periodické okrajové podmínky: MD + 6/16 REAL L velikost hrany kubické simulační buňky VECTOR r1, r2 kde vektor r = (r.x,r.y,r.z) oba vektory musí ležet v základní buňce VECTOR dr := r2 - r1 rozdíl vektorů bez ohledu na okrajové podmínky IF dr.x < -L/2 THEN dr.x := dr.x + L ELSE IF dr.x > L/2 THEN dr.x := dr.x - L IF dr.y < -L/2 THEN dr.y := dr.y + L ELSE IF dr.y > L/2 THEN dr.y := dr.y - L IF dr.z < -L/2 THEN dr.z := dr.z + L ELSE IF dr.z > -L/2 THEN dr.z := dr.z - L Vektor dr nyní směřuje od vektoru r1 k nejbližšímu obrazu vektoru r2 Výpočet druhé mocniny vzdálenosti nejbližších obrazů: REAL rr := dr.x**2 + dr.y**2 + dr.z**2
Periodické okrajové podmínky: MC + 7/16 V MC (zpravidla) nepotřebujeme vektor r 12 = r2 r1, stačí vzdálenost REAL L velikost hrany kubické simulační buňky VECTOR r1, r2 kde vektor r = (r.x,r.y,r.z) oba vektory musí ležet v základní buňce VECTOR dr := r2 - r1 rozdíl vektorů bez ohledu na okrajové podmínky REAL rr := (L/2 - abs(l/2-abs(dr.x)))**2 + (L/2 - abs(l/2-abs(dr.y)))**2 + (L/2 - abs(l/2-abs(dr.z)))**2
Výpočty [../simul/ar/showdrop.sh] 8/16 Příklad. Simulujeme kapku argonu v kubických periodických okrajových podmínkách. Mějme 1000 atomů za teploty 85 K. Vzdálenost mezi povrchy periodických obrazů kapky by měla být rovna průměru kapky. Vypočtěte velikost boxu v Å. Hustota kapalného argonu je 1.4 g cm 3. 90 Å
Měření Trajektorie = posloupnost konfigurací (MD: v čase) Konvergenční profil: vývoj veličiny (časový profil, ) problémy jsou líp vidět kumulativní (running average, ) lze odhadnout nepřesnost Typ zpracování: střední hodnoty ( ergodická hypotéza) méně často fluktuace Typ veličiny: P/MPa 50 45 40 35 30 25 9/16 0 20 40 60 80 100 120 140 160 180 200 mechanické (teplota, tlak, vnitřní energie, parametry uspořádání... ) entropické (S, F, μ,... ) strukturní (korelační funkce, počet sousedů, analýza klastrů... ) pomocné či kontrolní veličiny (parametry uspořádání, integrály pohybu v MD) t/ps
Náhodné chyby 10/16 veličina = (odhad střední hodnoty) ± (odhad chyby) Aritmetický průměr (příklad statistiky * ): X = 1 m Standardní chyba = standardní odchylka statistiky, obv. se označuje σ 2 σ X = X X Pro nekorelované (nezávislé) X a velké m má X Gaussovo rozdělení. m =1 X (X σ X, X + σ X ) s pravděpodobností 68% X (X 2σ X, X + 2σ X ) s pravděpodobností 95% Odhad standardní chyby nekorelovaných dat: m σ odhad =1 = ΔX2 X m(m 1), X kde ΔX = X X * též statistický funkcionál, v metrologii snad měřicí funkce (angl. measurement function)
Zvyky a terminologie 11/16 Fyzika: σ fyzika X = σ X (ovšem její odhad) σ odhad X = odhadnutá směrodatná/standardní chyba/nejistota; nepřesně (odhadnutá) chyba/nejistota, standardní/směrodatná odchylka (rozumí se aritmetického průměru či jiné statistiky) Obvyklá notace: 123.4 ± 0.5 123.4(5) Jistota začíná na ±5σ X (hladina významnosti 0.999 999 43) Biologie, ekonomie, inženýrství: hladina významnosti (confidence level) 95 % (data jsou s pravděpodobností 95 % uvnitř mezí). V případě Gaussova rozdělení: σ biologie X 2 σ fyzika X Chemie: často ignorováno; pokud udáno, tak nikdo neví, zda σ chemie X 2σ X Vždy nutno udat typ chyby/nejistoty = σ X nebo
[cd simul; corelrnd.sh 2000] 12/16 Analýza časové řady a odhad náhodných chyb Problém: korelace (ukázka: +1 = r + Gauss ) bloková metoda: X j = 1 B B =1 X +(j 1)B analýza korelací m =1 σ X = ΔX2 (1 + 2τ) τ = m(m 1) k=1 c k c k = ΔX 0ΔX k (ΔX) 2 MC: c k monotonně klesá [přesně: c k = λ =1 c λλ k, λ ( 1, 1)] MD: c k c(t) (časová autokorelační funkce): tlumené oscilace lépe = kombinace: mírně zblokovat a pak τ c 1 running average ( 10 bloků): σ X 0.6[m x 2. půlka (X) min 2. půlka (X)] nebo pro jistotu (vzorec je nepřesný): chyba m x 2. půlka (X) min 2. půlka (X) pak X (X chyba, X + chyba ) s pravděpodobností 85% (pro dlouhé časové řady)
Cvičení/ukázka [simul/errplot.sh 4096 0.9] 13/16 Vygenerujte korelovaná náhodná data (proces 1. řádu) X k+1 = qx k + kde = [0,1) nebo Gauss apod. a q < 1. Vypočtěte aritmetický průměr i chybu různými metodami. Pozn.: analytický výsledek je σ X = 1 + q 1 q V r X m = 1 1 q kde variance (fluktuace) je Var X = (X X) 2 V r m
Časová autokorelační funkce + 14/16 Rychlostní časová autokorelační funkce (velocity-velocity autocorrelation function) kapalného argonu: 150 K, 1344 kg m 3, 120 K, 1680 kg m 3. Výsledky trajektorie dlouhé 100 ps pro 216 Lennard-Jonesových částic c v (t) 1 0.5 0 0 0.5 1 1.5 t/ps Typické chování (MC i MD): tekutina: lim t c(t) = konst t 3/2 (hydrodynamic tail) přeskoky mezi stavy (vysoká bariéra): c(t) λ t (λ těsně pod 1)
Analýza chyb 15/16 Součet nezávislých měření: dvojmoci standardních odchylek jsou aditivní Příklad. Počítáme = 1 0 = ƒ ( )d přibližně Simpsonovým vzorcem, 1 0 ƒ ( )d 1 6 [ƒ (0) + 4ƒ (0.5) + ƒ (1)] Pro ƒ ( ) máme následující data se standardními chybami: Vypočtěte včetně odhadu chyb. 0 0.5 1 ƒ ( ) 1.34(5) 1.57(3) 1.77(6) = 1 6 [1.34 + 4 1.57 + 1.77] = 1.565 σ( ) 2 = (0.05/6) 2 + (0.03 4/6) 2 + (0.06/6) 2 = 0.000569 σ( ) = 0.024 = 1.565(24) Pro násobení a dělení platí to samé pro relativní chyby Příklad. Vypočtěte 3.46(7)/ 0.934(13). 3.70(9)
Analýza chyb Chyba funkce ƒ proměnné s chybou je (linearizovaný vztah, tj.pro malé σ): 16/16 ƒ ( ± σ ) = ƒ ( ) ± ƒ ( )σ ln( ± σ ) = ln ± σ, exp( ± σ ) = exp ± σ exp, Příklad. Vypočtěte aktivitu H + z ph = 2.125(5). 1 ± σ = 1 ± σ 2 (H + ) = 0.00750(9)