Monitoring kritických systémů - Case study Tomáš Hrubý, AutoCont CZ tomas.hruby@autocont.cz 17.2.2011
Krátké seznámení se společností AutoCont CZ a.s. česká soukromá společnost holdingového uspořádání mateřská firma založená roku 1990 v Ostravě od roku 1994 též na Slovensku 50 poboček po celém území ČR a SR Celkové tržby v roce 2009 cca 2.500 mil. Kč přes 800 zaměstnanců v ČR a SR certifikát jakosti ISO 9001:2001 a ISO/IEC 20000:05 Platinum partner společnosti CA 2 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Agenda Úvodní situace Zvolené řešení použité produkty CA Architektura Praktické zkušenosti z implementace Pozitivní zkušenosti Problematické body Dotazy? 3 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Úvodní situace Požadavek na dohled zcela nového datacentra Dohledované prvky: Servery Windows, Linux (celkem cca 50) Databáze Oracle, MS SQL Síťové prvky (převážně Cisco) Nutno dohledovat infrastrukturu datacentra jističe, čidla teploty atd. Nutný dohled specifických aplikací psaných na zakázku možnost logování stavu pomocí syslogu Požadovaná integrace s CA ServiceDesk Manager a CMDB 4 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Zvolené řešení použité produkty CA CA Spectrum 9.1.2 Centrální konzola Vizualizace struktury sítě Zpracování SNMP událostí všeho druhu přímo nebo s pomocí SBGW Notifikace Reporting CA BOXI CA Event Integration for Spectrum 1.2 Zpracování logů aplikací zasílaných přes Syslog CA SystemEdge Dohled operačních systémů Windows Server, Linux CA DB Insight Dohled databází Oracle, MS SQL 5 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Architektura řešení 6 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Implementace CA Spectrum Instalace serverové části verze 9.1.2 bez komplikací Discovery síťových prvků vesměs úspěšné out-of-the box Vizualizace prostředí v konzoli OneClick velmi komfortní a přehledná (možno customizovat podle potřeby) Pro dohled DC (typicky jističe) nutno zajistit MIB Velmi dobré zkušenosti s modulem SouthBound GW například jističe či čidla teploty lze výborně vizualizovat na jednotlivé objekty Zpracování událostí (Event management) pomocí Event console zpravidla bez problémů 7 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Implementace CA SystemEdge Agenti CA SystemEdge slouží pro detailnější dohled operačních systémů (různých platforem) Instalace vesměs bez komplikací Problém ve spojení se Spectrum 9.1.2 nelze agenty nastavovat z konzole OneClick, tato funkce je k dispozici až v 9.2 Obecně chybí ve spojení se Spectrum centrální správa agentů (je k dispozici v produktu ehealth) 8 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Implementace CA Event Integration Produkt použit především pro zpracování dat zasílaných formou syslogu Příjem syslogu pomocí aplikace Kiwi syslog server Instalace a úvodní konfigurace CA EI o něco složitější, nicméně výsledek dobrý Jde o mimořádně mocný nástroj, který umí zpracovat události velice dobře bohužel ale není práce příliš intuitivní optimální je upravovat politiky ručně přímo v XML souborech, vyžaduje čas na pochopení. Je nutno komunikovat s dodavateli aplikací, pokud posílají logy v jednotném formátu, vše se velmi zjednoduší. 9 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Implementace CA DB Insight Zpočátku komplikace s kompatibilitou s Oracle clusterem Původně zvažován produkt ehealth DPO, jeho podpora ale byla ukončena Výsledkem byl přechod na DB Insight, kde byla (byť s jistým zpožděním) podpora doplněna Vlastní instalace a funkce je po získání aktuální verze OK Určitou komplikací je pouze name resolution produkt je značně háklivý na stav DNS, virtuálních jmen clusteru atd 10 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Přechod na verzi 9.2 a komplikace s ní spojené V průběhu projektu jsme se rozhodli Spectrum upgradovat na novou verzi 9.2 Velmi zásadním důvodem možnost ovládání SystemEdge z OneClick Kromě toho ale řada zlepšení v event managementu a dalších oblastech Upgrade proběhl na první pohled bez problémů, ale: Bohužel se začala projevovat řada bugů nové verze (např. nefunkční REGEX v Event Console) Postupné řešení aplikace cumulative patche H01, později H02 s ním již systém poměrně stabilní a klady 9.2 převládají (k dispozici je již H03, který situaci dále zlepšuje) 11 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Shrnutí - klady a problematické body Klady Naprostá spokojenost s OneClick konzolí Velmi se osvědčilo SBGW pro dohled prvků datacentra Po překonání úvodních komplikací představuje Event Integration velmi mocný nástroj Dobrá podpora ze strany CA Problematické body Integrace SystemEdge a DB Insight se Spectrem není zatím dokonalá Ne zcela podařený upgrade na 9.2 (výsledek dobrý, ale komplikací bylo víc, než by bylo žádoucí) 12 February 17, 2011 Monitoring kritických systémů Case study.pptx Copyright 2011 AC CZ.
Vaše dotazy? Tomáš Hrubý, AutoCont CZ Tomas.hruby@autocont.cz 17.2.2011
Děkuji vám za pozornost