Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze

Podobné dokumenty
Manažerský informační systém pro efektivní řízení zdravotnictví ve Středočeském kraji

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Business Intelligence

TM1 vs Planning & Reporting

Infor Performance management. Jakub Urbášek

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Základní informace o co se jedná a k čemu to slouží

Manažerský reporting a finanční plánování Targetty

Datová věda (Data Science) akademický navazující magisterský program


Reportingová platforma v České spořitelně

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Business Intelligence. Adam Trčka

Analýza dat skoro zadarmo možnosti rozborů pro malé organizace

Základy business intelligence. Jaroslav Šmarda

Efekty a rizika Business Intelligence

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

ČD Telematika a.s. Efektivní správa infrastruktury. 11. května Konference FÓRUM e-time, Kongresové centrum Praha. Ing.

ČMSS: CRM systém pro efektivní práci s klienty

IT integrace na univerzitách

Aktuální otázky provozu datových skladů PAVEL HNÍK

PŘÍLOHA C Požadavky na Dokumentaci

Sjednocení dohledových systémů a CMDB

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

KITTV PedF UK TÉMATA BAKALÁŘSKÝCH PRACÍ pro školní rok 2010/2011

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Architektura softwarových systémů

Zkušenosti s Business Intelligence ve veřejném sektoru České republiky

Specifikace předmětu plnění Datová tržiště

Informační systém pro podporu řízení, správu a zjišťování aktuálního stavu rozvrhované výuky

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

Ing. Miloš Maryška, Ph.D. Seminář VŠE, ČSSI a ICT UNIE

Rozšíření systému na sledování státní a veřejné podpory pro Ministerstvo financí

Informační systémy 2006/2007

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Efektívne riadenie financií v ISS Facility Services Prípadová štúdia BI

MĚSTSKÝ ROK INFORMATIKY - ZKUŠENOSTI S NASAZENÍM STANDARDNÍCH APLIKAČNÍCH ŘEŠENÍ V PROSTŘEDÍ STATUTÁRNÍHO MĚSTA LIBEREC

Koncept architektury reportovacích a datově analytických systémů

Metodika analýzy. Příloha č. 1

Outsourcing v podmínkách Statutárního města Ostravy

Moderní metody automatizace a hodnocení marketingových kampaní

Vývoj informačních systémů. Přehled témat a úkolů

Srovnání implementace a využití systému Microsoft Project v rozdílném produkčním prostředí případová studie

Cesta k optimalizaci provozních. technologických zařízen

Chytrá systémová architektura jako základ Smart Administration

ELEKTRO - IT TECHNIK (vhodné i pro absolventy)

ICT plán školy pro školní rok 2014/2015

1. Integrační koncept

Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer

Business Intelligence pro univerzitní prostředí

Softwarová podpora v procesním řízení

Cíle a metodika průzkumu

GIS a Business Intelligence

IT podpora optimalizace provozu technologií rozsáhlého areálu

Business Intelligence a datové sklady

powerful SAP-Solutions

Ondřej Bothe, Richard Dobiš

Ing. Roman Danel, Ph.D. 2010

REALIZACE Strategického záměru

výskyt události reakce na událost

Business Intelligence

Zpráva o Digitální cestě k prosperitě

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

Aplikace moderních ICT metod zvyšování výkonnosti, kvality a transparentnosti systémů Státního zdravotního dozoru

Datové sklady ve školství

Informace ke stavu celoměstsk xxx

AKTUALIZACE Dlouhodobého záměru

Elektronické zpracování požadavků - evidence v databázi akcí

Dotazníkové šetření pro příjemce (veřejné vysoké školy - pedagogické fakulty) v rámci výzvy 02_16_038 - Pregraduální vzdělávání

Projekt SEPIe - Datový sklad a analytická nadstavba MIS - manažerský informační systém pro vedoucí zaměstnance resortu MV (konference)

Ing. Petr Kalčev, Ph.D.

Vývoj informačních systémů. Přehled témat a úkolů

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Slovenská spořitelna:

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Trendy v (mobilní) Business Inteligence v ČR dotazníkové šetření

Centralizace aplikací ve VZP

Využití mobilní technologie O2 pro dohledové systémy a sběr medicínských dat

Komise pro informatizaci

Snadný a efektivní přístup k informacím

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Centrální univerzitní Moodle na Vysoké škole báňské - Technické univerzitě Ostrava případová studie

PODNIKOVÁ INFORMATIKA

Pro rok 2016 byly vedením stanoveny následující cíle:

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Databázové systémy. 10. přednáška

Tomáš Fronk. Správa sítě, serverů a pc / Vývoj SW 36 let

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

ÚVOD Představení Národního screeningového centra

Roční periodická zpráva projektu

Implementace SOA v GE Money

Produkty třídy BYZNYS

Základní pomůcka pro garanty bc. a mgr,. studia na FSV UK

Transkript:

Úvod Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze Ota Novotný, Lukáš Hrnčíř katedra informačních technologií VŠE v Praze email: novotnyo@vse.cz Business Inteligence (BI) má již pevnou pozici v telekomunikacích, bankovnictví a ostatních business oblastech. V akademickém prostředí v zahraničí se BI teprve prosazuje a v ČR čeká na svoji příležitost. Hlavním přínosem implementace datového skladu v rámci vysoké školy je integrace roztříštěné datové základny ze zdrojových systémů, zrychlení a zefektivnění reportingu a tím pádem ke zlepšení podpory rozhodování a zefektivnění vzdělávacího procesu, což by mělo umožnit například identifikací problematických studentů, zhodnocení studijních programů a učitelů, monitorování rozvoje a pokroků studentů podle určených standardů, apod.. V zahraničí, zejména v USA, Kanadě a Anglii, se BI v akademickém prostředí využívá celkem úspěšně. Existuje velké množství podrobně zdokumentovaných projektů i SW řešení navržených přímo pro školy. Na vysokých školách v ČR nebyly zaznamenány připravované, probíhající či dokončené projekty datového skladu a navazujících BI aplikací. V rámci úspěšně obhájených diplomových prací [HRNČÍŘ 2006] a [PETR 2006] byl na katedře informačních technologií VŠE v Praze uskutečněn pilotní projekt implementace datového skladu a návazných aplikací. Průběh pilotního projektu Jako základ posloužila data Studijního informačního systému VŠE (SIS), který obsahuje data shromážděná za posledních 15 let. To umožňuje podrobnou analýzu historických dat. Nyní používá škola několik funkčních provozních databází, které fungují na principu transakčního zpracování, ve kterých se zaznamenávají jednotlivé události chronologicky. Jednotlivé systémy zajišťující informační potřeby VŠE jsou v současné době rozděleny do několika aplikací, z nichž každá má vlastní datovou základnu např. registrace a zápisy, bakalářské zkoušky, centrální databáze, atd. Předmětem těchto produkčních databází školy jsou mimo jiné záznamy např. o studentech, vyučujících, vyučovaných předmětech, jednotlivých konkrétních kurzech, jejich aktuální obsazení, atd. Základním předpokladem implementace datového skladu jsou stabilní zdrojové systémy, což v tomto případě není bohužel bezezbytku splněno. Momentálně přetrvává nejistota ohledně dalšího vývoje nového informačního systému na VŠE. Datový sklad vyvinutý v rámci pilotního projektu nemá za cíl zajistit komplexní BI/DW řešení pro celou VŠE, ale jen části týkající se Studijního informačního systému VŠE. To potom může posloužit spolu s analýzou požadavků jako prototyp pro další rozvoj BI na VŠE. Hlavním zdrojem datového skladu je databáze Projektu evidence studia (PES), která vznikla v roce 2000 jako jeden z prvních pokusů o datovou a aplikační integraci na VŠE. PES obsahuje většinu dat studijního informačního systému a zajišťuje např. následující funkcionalitu: historie studenta, studijní informace, tvorba rozvrhu či výběrové řízení pro výjezdy do zahraničí. Databáze PES je provozována na databázi Oracle 9i a fyzicky je umístněna na jednom ze serverů na sále Výpočetního centra. Aplikační prostředí je realizováno skriptovacím jazykem PHP3. PES vznikl z Centrální databáze, jejíž počátky sahají až do roku 51

Ota Novotný, Lukáš Hrnčíř 1990. V roce 1992 vznikla potřeba nového databázového systému určeného pro studijní agendu v souvislosti s přechodem na kreditní systém. Proto byl zvolen databázový systém Progress, který slouží dodnes. Mezi uživatele centrální databáze patří referentky, zástupci pedagogického oddělení, děkani, proděkani, zástupci kateder a učitelé. Projekt byl rozdělen do následujících fází: 1. Zmapování metodik vhodných pro implementaci datového skladu v akademickém prostředí 2. Multikriteriální výběr metodiky 3. Aplikace metodiky v akademickém prostředí VŠE vytvořením datového skladu z dat SIS 4. Navazující analytická BI aplikace Multikriteriálním výběrem podle zvolených kriterií s ohledem na využití v akademickém prostředí byla pro pilotní projekt vybrána metodika R. Kimballa The Data Warehouse Toolkit [KIMBALL 2002], která pracuje s datovými tržišti, které tvoří datový sklad. Hlavní výhodou je rychlejší vývoj po menších částech. Narozdíl od Inmonova přístupu [INMON 2002], který je velmi náročný na počáteční analýzu, Kimball doporučuje vybudovat datová tržiště podle analytických potřeb vybraných oddělení firmy, kterým bude datové tržiště sloužit. V případě VŠE je to část Studijního informačního systému (SIS), která bude sloužit hlavně pracovníkům fakult, učitelům a vedení školy. Dále tato metodika vhodným způsobem pokrývá celý životní cyklus vytvářeného systému, poskytuje velmi cenné konkrétní příklady a případové studie. Takový přístup se jeví jako optimální pro tuto konkrétní situaci, tj. existenci roztříštěné datové základny. Tato metodika však nepokrývá odpovídajícím způsobem fázi analýzy požadavků, a byla proto v této oblasti doplněna metodikou M. Humphriese [HUMPHRIES 2001]. V metodice R. Kimballa je definováno 5 fází projektu: 1. Plánování projektu 2. Analýza požadavků 3. Technologická část 4. Datová část 5. Aplikační část V rámci plánování projektu bylo zapotřebí zajistit si kontakt na osobu či organizační jednotku v organizaci, jenž bude plnit funkci sponzora. Tuto roli převzala Katedra informačních technologií (KIT). Dalšími kroky při plánování bylo zjištění motivace a očekávání organizace související s implementací datového skladu, posouzení realizovatelnosti projektu, definice přínosů a nákladů projektu a v neposlední řadě také samotný plán projektu Analýza požadavků byla prováděna prostřednictvím interview, pro které byla vybrána Ing. Helena Benáčanová, CSc., která se věnuje oblasti reportingu pro katedru KIT a je potenciálním koncovým uživatelem BI aplikace a profesor RNDr. Jan Pelikán, CSc., který reprezentuje vedení fakulty. Uživatelské požadavky získané v interview byly analyzovány, vybrány ty hlavní a hlavním požadavkům byly přiřazeny priority (viz tabulka 1) Požadavek Priorita Složitost Identifikace recyklovaných studentů Vysoká Vysoká Plnění studijních povinností studenty Vysoká Vysoká 52

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze Zápočty a zkoušky Vysoká Střední Bakalářské zkoušky Vysoká Střední Státní zkoušky Vysoká Střední Počty studentů a učitelů Vysoká Střední Úspěšnost předmětů, zkoušek a bakalářských zkoušek Střední Střední Neúspěšné registrace Nízká Nízká Tab 1: Uživatelské požadavky zjištěné z interview s přiřazenými prioritami a složitostí V technologické části byl nejprve sestaven model nezávislý na platformě a SW. Skládal se z následujících vrstev: zdrojové systémy, Data Stage Area (DSA), datové pumpy (ETL), relační datový sklad, OLAP datamart a prezentační vrstva. Na základě požadavků definovaných pro každou vrstvu byly vybrány konkrétní produkty. Řešení bylo zvoleno na základě tvorby prototypů. Nejprve byl vytvořen prototyp pro řešení od firmy Microsoft, který je založen na databázovém serveru MS SQL server 2000, Analysis services pro ETL a Excelu pro prezentaci výstupů. Další prototyp byl založen na řešení od firmy Oracle a obsahuje databázový server Oracle 10g, Oracle warehouse Builder (OWB) pro tvorbu modelu datového skladu a ETL, Analytic Workspace Manager (AWM) pro tvorbu OLAP kostek a Excel pro prezentaci výstupů. Pro projekt datového skladu na VŠE bylo ve finále zvoleno řešení od firmy Oracle, a to zejména díky tomu, že jeden z hlavních zdrojových systémů je také založen na databázovém serveru Oracle, což usnadní přenos dat ze zdrojových systémů do datového skladu a OWB poskytuje vývojáři lepší komfort a větší množství komponent při vývoji datových pump při pokročilejší podpoře metadat. Nevýhodou řešení firmy Oracle je na druhou stranu především jeho HW náročnost oproti nástrojům firmy Microsoft. Na základě analýzy požadavků a analýzy dat ze zdrojových systémů byl sestaven návrh dimenzí a ukazatelů a byly navrženy možné vztahy mezi dimenzemi a ukazateli. Na základě dimenzionální analýzy byl sestaven fyzický model datového skladu. Následovala tvorba datových pump v OWB, které tvořily časově nejnáročnější oblast technologické části. Nejprve ETL ze zdrojových systémů do DSA, kde se jednalo zejména o přenos tabulek 1:1 ze zdrojových systémů (aby nebyly zbytečně zatěžovány) nebo nahrání textových extraktů. V DSA došlo k čištění dat a jejich přípravě pro nahrání do datového skladu. Datové pumpy z DSA do datového skladu obsahovaly náročnější transformace dat, jednalo se zejména o naplnění dimenzí, transakčních tabulek a výpočet faktů. Následovala transformace relačních dat z datového skladu do OLAP datamartu pomocí Analytic Workspace Manager (AWM). Prezentační vrstva byla realizována pomocí plugginu do v Excelu. Výstupy pilotního projektu Součástí prezentační vrstvy jsou výstupy reflektující požadavky uživatelů uvedené v tabulce 1. Vzhledem k omezenému rozsahu článku jsou uvedeny pouze vybrané výstupy. 53

Ota Novotný, Lukáš Hrnčíř Tab 2: Úspěšnost bakalářských zkoušek celkově podle jednotlivých fakult a specializací Tab 2: Úspěšnost bakalářských zkoušek celkově podle jednotlivých fakult a specializací Bakalářské zkoušky, Fakulta informatiky a statistiky (1993-2005) 100% 90% 80% 70% 60% 50% 40% 30% % BZ Oml % BZ Uzn % BZ Neusp % BZ Usp 20% 10% 0% + 1993/1994 + 1994/1995 + 1995/1996 + 1996/1997 + 1997/1998 + 1998/1999 + 1999/2000 + 2000/2001 + 2001/2002 + 2002/2003 + 2003/2004 + 2004/2005 Obr. 1: Úspěšnost bakalářských zkoušek probíhajících na vybrané fakultě v čase V rámci interaktivních výstupů, jejichž část je uvedena v Tabulce 2 a na Obr. 1 je možné identifikovat problémové bakalářské zkoušky a na základě získaných výsledků aplikovat příslušná opatření (např. úprava času věnovaného na výuku problémového předmětu). Výsledkem je také splnění základního požadavku nasazení BI v akademickém prostředí zlepšení vzdělávacího procesu a příp. také prevence problémů. 54

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze Obr 2.: Způsob ukončení studia jednotlivých studentů na VŠE jako celku a v rámci vybraných fakult V interaktivním výstupu, jehož část je uvedena na Obr. 2 je možné identifikovat rozdíly v úspěšnosti studia na jednotlivých fakultách VŠE. Jak je vidět, mezi jednotlivými fakultami existuje významná disproporce a bude nutno dále hledat důvody takovéto odlišnosti. Závěrem Na VŠE byl v rámci pilotního projektu implementován datový sklad s navazující BI aplikací. Svým charakterem je tato kombinace v současné době ojedinělá, neboť není známa žádná jiná aplikace tohoto charakteru v prostředí vzdělávací instituce v ČR. Datový sklad Studijního informačního systému (SIS) integruje data z datově roztříštěných zdrojových systémů a umožňuje jejich další analýzu. Pro implementaci datového skladu na VŠE byla pomocí multikriteriálního výběru zvolena metodika R. Kimballa [KIMBALL 2002]. Užití této metodiky při tvorbě tohoto datového skladu ukázalo, že se dá aplikovat i na toto specifické prostředí. Charakter systému je pouze ukázkový a jeho úkolem je pouze demonstrovat schopnosti BI/DW v akademickém prostředí. Momentálně není systém nasazen do reálného použití. Před nasazením do (testovacího) provozu bude nutné zabývat se otázkami bezpečnosti systému, definicí rolí a přístupových práv. Dále také otázkami technického řešení a infrastruktury. Po nasazení do provozu následuje v rámci životního cyklu systému fáze údržby a rozvoje. Rozšíření funkčnosti systému může být dosaženo například doplněním prezentační vrstvy dalšími specializovanými reportovacími a analytickými nástroji pro koncové uživatele. Analýza požadavků, datový sklad a navazující BI aplikace bude dále rozvíjena v rámci studentských prací tak, aby mohla být použita jako základ pro BI řešení VŠE jako celku. Vytvořený datový sklad a aplikace budou také sloužit jako prototyp, který může ukázat uskutečnitelnost návrhu a praktické přínosy nasazení BI pro vedení a zaměstnance školy. Použitá literatura: [HRNČÍŘ 2006] Hrnčíř, L: Aplikace Business intelligence ve studijní agendě VŠE v Praze datové pumpy a realizace datového skladu, Diplomová práce, VŠE, 2006 [HUMPHRIES 2001] Humphries, Mark: Data warehousing data a implementace, Praha, Computer press, 2001, 257 s., ISBN 80-7226-560-1 55

Ota Novotný, Lukáš Hrnčíř [INMON 2002] Inmon, W. H.: Building the Data Warehouse, Canada, John Wiley & Sons, 2002, 412 s., ISBN 0-471-08130-2 [KIMBALL 2002] Kimball R., Ross M.: The Data Warehouse Toolkit second edition, Wiley computer publishing, New York, 2002, 447 s., ISBN 0-471- 20024-7 [PETR 2006] Petr, J: Aplikace business intelligence ve studijní agendě VŠE v Praze aplikační část, Diplomová práce, VŠE, 2006 56