Analýza reziduí gyroskopu Petr Šimeček Cílem studie bylo analyzovat přesnost tří neznámých gyroskopů, jež pro účely této studie budeme nazývat Gyroskop 1, Gyroskop 2 a Gyroskop 3. U prvních dvou gyroskopů jsme měli k dispozici skutečné hodnoty a bylo tedy možno stanovit přesnou chybu gyroskopu. V třetím případě jsme sice neznali skutečnou hodnotu, ale měření jsme mnohokrát opakovali. Práce je rozdělena do tří částí. V první části budeme diskutovat data, jež máme k dispozici. V druhé části jsou popsány provedené analýzy a jejich výsledky. Třetí část shrnuje dosažené závěry a interpretuje je. Veškeré výpočty byly provedeny v prostředí R. V následujícím textu budeme často hovořit o směrodatné odchylce chyb či reziduí. Dovolil bych si připomenout, že směrodatná odchylka je odmocnina z rozptylu a že za předpokladu normality se 95% chyb nachází v rozmezí přibližně plus mínus dvojnásobek směrodatné odchylky. 1 Data 1.1 Gyroskop 1 Data tvoří 10543 úhlových rychlostí naměřených Gyroskopem 1 spolu se stejným počtem naměřených teplot tohoto gyroskopu. Data byla zaznamenávána s frekvencí 1 sekunda. Chybu gyroskopu v závislosti na čase můžeme pozorovat na Obrázku 1. Pozorovaný vývoj chyby gyroskopu v závislosti na čase se zdá býti dobře vysvětlitelný změnou teploty gyroskopu viz Obrázek 2. Ač se daná závislost chyby na teplotě jeví býti na první pohled lineární, ve skutečnosti je zde signifikantní kvadratický trend a informační kritéria ukazují na závislost ještě vyššího stupně. 1.2 Gyroskop 2 Data tvoří 11715 úhlových rychlostí naměřených Gyroskopem 2 opět spolu naměřenými mi. Frekvence měření je opět jedna sekunda. Chybu gyroskopu v závislosti na čase můžeme pozorovat na Obrázku 3. Závislost chyby na teplotě zachycuje Obrázek 4. Povšimněme si především výrazně vyššího rozsahu teplot než v prvním případě. Zdá se, že u vyšších teplot dochází k podstatné změně závislosti chyby gyroskopu na teplotě. Abychom mohli Gyroskop 2 a Gyroskop 1 porovnat, budeme uvažovat pouze pozorování, kde nepřekročila 37 C a vyloučíme zjevně odlehlá pozorování 20 a 21. 1
2046 0 200 400 0 2000 4000 6000 8000 Obrázek 1: Závislost chyby Gyroskopu 1 na čase 2046 0 200 400 20 10 0 10 20 30 40 Obrázek 2: Závislost chyby Gyroskopu 1 na teplotě 1.3 Gyroskop 3 K dispozici máme 2290249 pozorování, jež jsou zaznamenávána s frekvencí desetiny sekundy (viz Obrázek 5). Takto obrovský objem dat vytváří při zpracování enormní nároky jak na paměť, tak na výkon počítače. Některé standardní funkce jazyka R nebylo z těchto důvodů možno použít. Pozorování se periodicky opakují, přičemž délka periody je přibližně 4.1 sekunda. Rozsah teploty je podstatně nižší než v předchozích dvou případech, od 32.3 C do 37.7 C. Bohužel délka periody se během experimentu mění. Na začátku je perioda spíše kratší (prvních pět: 3.9, 4.0, 3.9, 3.9, 4.0) a na konci spíše delší (posledních 2
2850 0 40 80 0 2000 6000 10000 Obrázek 3: Závislost chyby Gyroskopu 2 na čase 2850 0 40 80 20 0 20 40 60 Obrázek 4: Závislost chyby Gyroskopu 2 na teplotě pět: 4.1, 4.4, 4.3, 4.3, 4.1), ale lze ukázat, že tato změna není monotónní v čase neboli že perioda se střídavě zkracuje a prodlužuje. Tato skutečnost činí analýzu dat značně obtížnou, ne-li nemožnou. 2 Analýzy a výsledky 2.1 Gyroskop 1 Směrodatná odchylka chyb Gyroskopu 1 je na počátku 100.5 jednotek. Po korekci vzhledem k lineární závislosti na teplotě se tato odchylka sníží na 3
Prvnich 10 sekund gyro 20000 0 20000 0 2 4 6 8 10 Obrázek 5: Začátek pozorované řady 4.2, přičemž na každý stupeň teploty připadá korekce 6.8 jednotek úhlové rychlosti. Pokud místo lineární závislosti uvažujeme kvadratickou, sníží se nám směrodatná odchylka chyby po korekci až na 2.0. Výběr modelu podle Akaikeho informačního kritéria radí použít polynomiální závislost až šestého řádu neboli modelovat původní chybu gyroskopu jako = β 0 + β 1 t + β 2 t 2 + β 3 t 3 + + β 6 t 6 + ɛ, kde t je gyroskopu, β 0,..., β 6 reálné konstanty a ɛ zbylá, nevysvětlená odchylka. Směrodatná odchylka reziduí již ale výrazněji neklesne. Nepříjemným faktem je, že nevysvětlené části chyb se mezi sebou zdají býti korelované a to s dlouho pamětí viz graf autokorelační funkce, Obrázek 6. 2.2 Gyroskop 2 Směrodatná odchylka chyb Gyroskopu 2 je na počátku 10.0 jednotek. Tento gyroskop je tudíž při změnách teploty řádově přesnější než Gyroskop 1. Na teplotě je taktéž mnohem méně závislý. Jednomu stupni teploty odpovídá změna úhlové rychlosti o 0.7 jednotek. Po korekci na teplotu tudíž nedosáhneme tak velkého zlepšení jako v minulém případě. Při korekci polynomem šestého stupně v závislosti na teplotě má nevysvětlená část chyby směrodatnou odchylku 2.5 jednotek. Na rozdíl od Gyroskopu 1 se tato rezidua nezdají býti korelovaná (p hodnota Durbin Watsonova testu 0.34). 2.3 Gyroskop 3 Díky měnící se periodě je nesnadné data analyzovat. Je pochopitelně možné na základě bodů zvratu provést přibližné rozdělení řady na jednotlivé periody. V důsledku šumu je ale toto rozdělení nepřesné, navíc se nezdá být rozumné 4
Dlouha pamet ACF 0.0 0.4 0.8 0 10 20 30 40 Lag Obrázek 6: Autokorelační funkce nevysvětlené části chyb předpokládat, že by délka period byla násobkem desetiny sekundy. Ke všemu ke změnám teploty dochází skokově, jak lze pozorovat na Obrázku 7. Prvnich 100 sekund 34.55 34.65 0 20 40 60 80 100 Obrázek 7: Závislost teploty na čase I když tedy překonáme nesnáze, s nimiž se musíme při regresní analýze takto obrovského objemu dat nutně potýkat, zjistíme, že v důsledku výše uvedených faktů se Gyroskop 3 jeví mít po odstranění periodicity a korekci vzhledem k teplotě míti směrodatnou odchylku chyby kolem 1000 jednotek. Pomožme si tedy následujícím trikem abychom eliminovali periodicitu a vyrovnali se navíc s proměnlivou délkou periody, zprůměrujme naměřená po- 5
zorování po 10000. Nová data mají tedy 229 pozorování, přičemž směrodatná odchylka by měla být u nových dat přibližně setinou směrodatné odchylky původní. Závislost těchto nových dat na teplotě 1 je znázorněná na Obrázku 8. Soucty pres 10 000 pozorovani gyro 20 0 20 40 60 33 34 35 36 37 Obrázek 8: Závislost chyby nových dat na teplotě Zajímavý je fakt, že tato závislost se zdá být čistě lineární. Může to být však způsobeno nižším rozsahem teploty než v minulých případech. Korekce na teplotu je 6.8 jednotek na každý stupeň Celsia, tedy totožná jako v případě Gyroskopu 1. Lze tedy předpokládat, že tyto dva gyroskopy budou podobného typu. Bylo též ověřeno, že daný odhad se nezmění, když budeme průměrovat skupiny po 1000 a nikoli po deseti tisících. Směrodatná odchylka Gyroskopu 3 se však jeví být o několik řádů vyšší než u předchozích dvou gyroskopů. Lze předpokládat, že se tak děje v důsledku odlišné metodiky měření a že je to v důsledku toho, že při opakování měření dochází k zvýšení šumu 2. 3 Závěr Chyba přístroje Gyroskop 1 se zdá být na první pohled výrazně vyšší nežli přístroje Gyroskop 2. Tento rozdíl ale zmizí, pakliže provedeme korekci vzhledem k teplotě přístrojů, neboť Gyroskop 1 je na změnu teploty podstatně citlivější. Zbývající nevysvětlená má u obou přístrojů směrodatnou odchylku přibližně 2 2.5 jednotek. Experiment s Gyroskopem 3 byl proveden za použití odlišné metodiky, ale závislost chyby tohoto gyroskopu na teplotě se zdá být stejná jako u Gy- 1 Teplota je spočítána jako průměrná z oněch 10000 pozorování. 2 Opakování měření bylo realizováno za pomocí stále dokola se točícího motorku. Lze tedy předpokládat, že pohyb motorku má daleko k tomu býti rovnoměrným, jak ostatně ukazují i změny v délce periody. 6
roskopu 1. Tento přístroj se zdá být podstatně méně přesný, ale tuto chybu lze vysvětlit odlišným provedením experimentu. Postup použitý pro testování Gyroskopu 1 a Gyroskopu 2 se zdá být vhodnější než metoda pro Gyroskop 3. 7