Měření mřížkových parametrů, zpracování dat, a nejen to Fyzikální seminář 2013 Co má společného neuronová síť, genetický kód a shluková analýza, aneb netradiční způsoby analýzy dat v astronomii Viktor Votruba ASÚ AV ČR, ÚTFA MU
Proměnné hvězdy a jejich výzkum Sledování neplánovaného experimentu Pozorování jsou unikátní Pozorovací podmínky ovlivněny počasím Henrietta Swan Leavitt 1868-1921 detekce 2440 proměnných hvězd Identifikace změn jasnosti hvězdy resp. změn v pozorovaném hvězdném spektru. Různé typy proměnnosti: periodické, kvaziperiodické a aperiodické Zákrytové dvojhvězdy, Cefeidy, RR Lyrae Pomalu pulsující B hvězdy, delta Scuti atd. Vývoj pozorovací techniky fotografická deska, fotometr, CCD čip, robotické dalekohledy, družice Enormní nárůst počtu dat, velké nároky na kapacitu datového úložiště, nutnost automatické zpracování
OGLE II projekt ~ od roku 1996 Fotometrické sledování hustých polí hvězd v LMC, SMC a Galaktické výduti 1.3m dalekohled observatoř Las Campanas CCD mozaiková kamera 8 CCD čipů zorné pole 35'x35' Počet hvězd: LMC ~ 7 x 106 SMC ~ 2 x 106 Výduť~ 30 x 106
Družice GAIA start 20. listopadu 2013 Přesná astrometrie ~ 1 miliardy hvězd Určení pozice s přesností 20 mas, vzdálenosti a vlastní pohyb hvězdy Fotometrická měření + spektrograf Bp/Rp Každý objekt bude snímán zhruba 70x během doby zhruba 5 let. Spektrografy zabírají oblast: Modrý 330-680 nm a červený 640-1050 nm DPAC CU7 - SOS Konsorcium evropských vědců, zabývající se specifickým úkolem, detekcí a analýzou proměnných objektů, česká skupina je součástí Detekce a analýza světelných křivek hvězd Be Skupina si klade za cíl z pořízených dat vybrat horké hvězdy, roztřídit dle typu proměnnosti a detekovat anomální chování, například náhlá vzplanutí. Díky těmto datům pak budeme moci detailněji studovat fyzikální procesy formujících chování tohoto typu horkých hvězd. Testovací fáze algoritmů Veškeré námi vyvinuté algoritmy byly testovány na vybrané množině světelných křivek pořízených v rámci projektu OGLE
Motivace Vývoj automatických a robustních metod schopných bez zásahu člověka klasifikovat a třídit pozorování do již existujících tříd Metody musí být schopné objevit i nové třídy, resp. nové typy proměnných hvězd Musí být odolné vůči nerovnoměrnému vzorkování a menšímu počtu bodů Dostatečně rychlé a jednoduché Data-mining a jeho nástroje: shluková analýza neuronové sítě detekce vzorů
Neuronové sítě a jejich potenciál Funkce neuronové sítě N y=s ( i=1 w i xi + Θ ) Aktivační funkce, např. S = 1 e1 tx Proces učení, nutnost kvalitní trénovací množiny Riziko přeučení Naučená síť je velmi rychlá Různé konfigurace neuronové sítě Aplikace na ROTSE - Brett et al. MNRAS 2004, 353, p. 369
Shluková analýza Třídění jednotek do shluků na základě podobnosti Jednotky popsány vždy stejným souborem znaků Míra podobnosti je dána vzdáleností objektů Parametrické a neparametrické metody K means, SVM, Gaussian mixture... Minimalizovaná funkce n J = kj=1 i=1 x(i j) c j 2 učení, nutnost kvalitní trénovací k Proces počet shluků, n...počet datových bodů množiny Riziko přeučení c_j střed shluku Naučená síť je velmi rychlá Různé konfigurace neuronové sítě Aplikace na OGLE II - Sarro et al. A&A 2009, 506, p. 535
Hledání vzoru a anomálií SAX metoda Inspirace analýzou DNA - hledání shodných resp. podobných úseků v genetickém kódu Jednoduché určení míry podobnosti Lze použít i na detekci neznámých ojedinělých vzorů - anomálii BAAB C C B C
Hledání vzoru a anomálií SAX metoda Abeceda A = { x1,x2,...,xa} kde a značí velikost abecedy Předpoklad: Normalizovaná data mají přibližně Gaussovo normální rozdělení Podle předem spočtených hraničních bodů určíme pro každý bod křivky příslušný znak
Hledání vzoru a anomálií SAX metoda Určení podobnosti znakové sekvence určení vzdálenosti Řetězce Metrika pro určení vzdálenosti Tabulka vzdáleností
Be hvězdy a jejich fyzikální popis Horké hvězdy spektrální třídy B Rozsah teplot od 15 000 K až do 50 000 K Detekována přítomnost obálky Pozorována emise ve spektrální čáře Ha Rychle rotující hvězdy rychlost rotace dosahuje až 80% kritické rychlosti Zářením hnaný hvězdný vítr Intenzivní interakce fotonů s absorbujícími ionty, které jsou tak urychlovány. Pasivní plasma, zejména protony jsou pak urychlovány Coulombickými srážkami. Rychlost ztráty hmoty dosahuje až 10-6 hmot Slunce. Radiální a neradiální pulsace
Časová proměnlivost Be hvězd Dlouhodobá variabilita Pravděpodobně spojena se změnami okolo-hvězdné obálky. Typická časová škála zhruba 3 a více roků Střednědobá variabilita Může mít periodický charakter binární či vícenásobný systém, či periodické změny v disku. Typická časová škála v řádech měsíců až rok. Krátkodobá variabilita Změny desítek hodin až po několik dní. Je většinou periodického či kvaziperiodického charakteru, souvislost s neradiálními pulsacemi, rotací či binární povahy Náhlá vzplanutí - Outburst Ostrá, náhlé zjasnění. Typická časová škála vzplanutí v řádech dnů, s pomalým poklesem v řádech desítek dnů
Automatická klasifikace světelných křivek Abbé test dlouhodobého trendu Vhodné pro detekci a případné odstranění dlouhodobého trendu. Statistika je dána n 1 2 j=1 (x i+1 xi ) n Α= n 2 2 (n 1) (x x) i=1 i Odhad periody Určení periody je klíčové pro správné určení typu proměnnosti. K odhadu použita statistika založena na minimálním rozptylu fázové křivky Konstrukce fázové křivky S pomocí odhadu periody lze zkonstruovat fázovou křivku. Analýzou této křivky resp. jejího tvaru lze určit některé typy proměnnosti Rozeznávání tvaru světelné křivky Převod světelné křivky do znaků s pomocí metody SAX a hledání podobného slova mezi jednotlivými typy. Nejpodobnější slovo označuje typ. Mírou podobnosti je vzdálenost
Variabilita světelných křivek hvězd
Světelné křivky Be hvězd
Automatická klasifikace světelných křivek Cefeidy RR Lyr Zákrytové dvojhvězdy
Automatická klasifikace světelných křivek
Objev nového typu proměnnosti Databáze světelných křivek Be hvězd OGLE II LMC ~ 2457 hvězd Hledání křivek s náhlým vzplanutím ( outburstem ) Detekce 230 světelných křivek s outbursty Vzorek dále klasifikován na isolované, rekurentní, zašuměné a déletrvající outbursty 95% světelných křivek s rekurentními outbursty vykazuje nápadně shodné znaky Amplituda maximálního vzplanutí ~ 0.3 mag Předchozí práce tuto podobnost přehlédli ~ Mennickent et al. 2002 A&A, 393, p.887
Objev nového typu proměnnosti
Sumarizace výsledků Vyvinuli jsme rychlou a efektivní metodu pro klasifikaci světelných křivek podle proměnnosti. Aplikovali jsme tuto metodu na vybraný katalog proměnných hvězd projektu OGLE II z Velkého Magellanova Mračna. Porovnáním katalogového typu proměnnosti a námi určeného jsme obdrželi 90 procentní shodu Metoda je citlivá na správné konstrukci fázové křivky, tedy na správném odhadu periody Metoda umožnuje také detekci náhlých vzplanutí či jiných nápadných neopakujících se údálostí resp. anomálií Při hledání náhlých vzplanutí na vzorku s OGLE II detekce podobného chování
Co dál? Analýza statistických vlastností jednotlivých klasifikovaných typů Na identifikované zajímavé cíle zaměřit pozornost dalších přístrojů a systematicky je studovat Identifikace nových typů proměnnosti Tvorba fyzikálního modelu vysvětlující vlastnosti daného typu Verifikace a katalogizace dat Identifikace procesů vedoucí k podobnému chování horkých hvězd s rekurentním výskytem outburstů
Odhad periody světelné křivky Klíčová informace pro určení periodického typu proměnnosti Malý počet bodů tvořící světelnou křivku Velmi nerovnoměrné rozdělení pozorování v čase. PDM metoda minimalizace rozptylu ve fázové křivce ( Astrophysical Journal, 1978, 224, p. 953 ) Statistika je dána: 2 s Θ= 2 σ kde N 2 σ = i=1 ( x i x ) M 2 N 1 theta= a s sigma 2 (n 1) s j j s2 = j =1 M j =1 n j M
Odhad periody světelné křivky theta= s sigma