P. Vojtáš 1, J. Pokorný 1, T. Skopal 1, M. Nečaský 1, K. Matoušek 2, J. Kubalík 2, J. Šíma 3, S. Ţák 3, M. Víta 3, O. Novotný 4, M. Maryška 4 1 MFF UK, Malostranské nám. 25, 118 00 Praha {vojtas pokorny skopal necasky}@ksi.mff.cuni.cz 2 FEL ČVUT, Karlovo náměstí 13, 125 35 Praha 2 {matousek kubalik}@fel.cvut.cz 3 ÚI AV ČR, Pod Vodárenskou věží 271/2, 182 07 Praha 8 {stan sima vita}@cs.cas.cz 4 FIS VŠE, Nám. W. Churchilla 4, 130 67 Praha 3 {maryska novotny}@vse.cz Abstrakt: V tomto článku popisujeme koncepci sociální sítě informatiků ČR spolu s vývojem softwarového nástroje portálu, na němţ bude síť realizována. Prezentovány jsou rovněţ aktivity týkající se sběru a analýzy ICT poţadavků od firem a znalostí ICT získaných absolventy vysokých škol. Abstract: This paper describes the concept of social network of the ICT specialists in the regions of the Czech Republic. In particular, we focus on the web portal under development, i.e. a software tool serving for the network implementation. Associated activities concerning gathering and analyzing ICT requirements from companies and educational ICT knowledge of university graduates are presented. Klíčová slova: Sociální síť, webový portál, profil Keywords: Social network, web portal, profile 1. Východiska, koncepce a cíle sociální sítě Cílem projektu Sociální sítě informatiků v regionech ČR 1 (SoSIReČR) je podpora komunikace a spolupráce mezi ICT profesionály, univerzitami, firmami i veřejným sektorem v ČR. Projekt je zaměřen na vybudování sociální sítě (ve smyslu sociálního webu) informatiků ve všech regionech ČR jako základny pro partnerství různých typů. Cílem je zvýšení konkurenceschopnosti ČR v oblasti informatiky, zlepšení postavení ICT v ČR a její přínos společnosti. Projekt je hrazen z rozpočtu Evropského sociálního fondu a státního rozpočtu České republiky. Sociální síť informatiků ČR je podporován webovým portálem. Jeho hlavní přínos vidíme v těchto oblastech [3]: Usnadnění komunikace mezi informatiky v regionech i s dalšími subjekty z oblasti vzdělávání a výzkumu, hospodářské sféry a státní správy prostřednictvím globálního fóra a dalších, specifických diskusních fór resp. jejich tematicky zaměřených vláken pro centralizovanou diskusi naléhavých témat v oblasti informatiky, jako jsou např. studijní plány, financování výzkumu, apod. Zpřístupnění velkého mnoţství informací, materiálů a odkazů týkajících se informatiky a informatiků. Navazování a rozvíjení spolupráce, vytváření pracovních či zájmových skupin, vyhledávání vhodných entit (lidí, institucí, výzkumných týmů, či firem). 1 http://www.sosirecr.cz/ SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 259
Vojtáš, Pokorný, Skopal, Nečaský, Matoušek, Kubalík, Šíma, Ţák, Víta, Novotný, Maryška Zprostředkování nabídky a poptávky pracovních příleţitostí. Na projektu participuje několik organizací. Katedra softwarového inţenýrství MFF UK, téţ koordinátor projektu, se věnuje zejména analýze uţivatelských poţadavků, konceptuálnímu návrhu systému, komunikaci s regionálními koordinátory. Katedra kybernetiky FEL ČVUT zodpovídá za vývoj a technickou realizaci portálu. Problematice informatického výzkumu a vývoje v duchu cíle Operačního programu Vzdělávání pro konkurenceschopnost zlepšením podmínek výzkumu přispět k rozvoji vzdělanostní společnosti a následně konkurenceschopnosti České republiky se v rámci projektu věnuje Ústav informatiky AV ČR, v.v.i. (dále ÚI). Na Katedře informačních technologií FIS VŠE se zabývají zejména průzkumem znalostí ICT a poţadavků na ně ve vztahu VŠ a praxe. Článek popisuje stručně pro projekt nejdůleţitější základní koncepty a z nich vycházející aktivity. Přehled o odborných profilech a jejich rolích v budované sociální síti poskytuje sekce 2. Koncepci portálu je věnována sekce 3. Informatický výzkum a vývoj ve vztahu k samotnému účelu portálu je diskutován v sekci 4. Mapování znalostí z ICT získávaných na VŠ na poţadavky praxe se věnuje sekce 5. Závěry naznačují blízké i vzdálenější plány v řešení projektu. 2. Profily: nástroj sofistikovaného vyhledávání a sběru uživatelských požadavků V rámci projektu SoSIReČR vzniká profesní sociální síť informatiků, která nabídne kromě tradičních funkcí sociální sítě také důleţitý nástroj odborné profily (OP). Konceptem odborných profilů se moţnosti portálu budou lišit od tradičních sociálních sítí typu FaceBook, ale i od profesních sítí jako např. LinkedIn. Proto na odborné profily klademe v rámci projektu SoSIReČR mimořádný důraz. Odborné profily půjde pouţít k široké škále popisu a vyhledávání osob, projektů a dalších entit v rámci portálu. Poslouţí také samostatně ke sběru uţivatelských poţadavků a pro další zpětnou vazbu, např. formou jednoduchých webových formulářů. V této sekci představíme moţné způsoby vyuţití odborných profilů, coţ umoţní zahájit veřejnou diskusi k jejich uplatnění. Nejprve představíme OP po technické stránce a dále pak jejich potenciální praktické vyuţití v rámci portálu i mimo něj. Neformálně řečeno, odborný profil je strojově čitelný popis rozsahu znalostí v ICT. O něco formálněji je odborný profil instancí strukturovaného datového typu, kterým je nějaká hierarchie kategorií (klasifikační strom). Jako základní kategorizaci vhodnou pro popis odbornosti v ICT uvaţujeme ACM klasifikaci 2, která je všeobecně uznávaným standardem klasifikace ICT oborů. Například se jí anotují veškeré publikace vydávané ACM. V budoucnosti bychom rádi vyuţili i jiných klasifikací vyvinutých v rámci projektu SoSIReČR. OP je tedy navrţen obecně, aby bylo moţno do budoucna pouţít libovolný klasifikační strom. Do diskuse o nich chceme zapojit širší odbornou veřejnost, zejména prostřednictvím regionálních koordinátorů projektu. OP slouţí k numerickému ohodnocení jednotlivých kategorií dané klasifikace. Vyjdeme-li např. z ACM klasifikace (má stromovou strukturu), vyrobíme OP tak, ţe kaţdou kategorii ohodnotíme číslem 1-5. Jednička znamená velmi málo, pětka nejvíce. Konkrétní význam stupnice je samozřejmě závislý na pouţití, viz případové studie v sekci 2.3. Ohodnotit můţeme libovolný počet kategorií, neohodnocené kategorie lze chápat jako 2 http://www.acm.org/about/class/ 260 SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011
ohodnocené číslem 0 vůbec. Protoţe schéma OP je zaloţeno rovněţ na stromech, můţeme hodnotit kategorie nejen na nejvyšší úrovni (u ACM kategorie A-K), ale můţeme se libovolně vnořovat a ohodnocovat podkategorie na jakékoliv úrovni hierarchie, a to nezávisle na hodnocení kategorie přímo nadřazené. Příklad: Chceme-li podle ACM klasifikace popsat odborným profilem znalosti vědce, můţeme ho ohodnotit jako: velmi zdatného (4) v informačních systémech (kategorie H. Information Systems) a s průměrnými znalostmi (3) v softwaru (kategorie D. Software). Chceme-li svoje volby specifikovat podrobněji, zjemníme např. druhé ohodnocení (D. Software) ohodnocením v rámci odpovídajícího podstromu, kde zvolíme 3 pro D.2 softwarové inţenýrství, 4 pro D.4 operační systémy a 2 pro D.m různé (viz obrázek 1). 2.1 Editace OP a vizualizace Protoţe OP vznikají jako součást portálu, tedy webové aplikace, byla vyvinuta implementace komponenty pro vizualizaci a editaci OP na webu. OP je vizualizován po částech vţdy je vidět pouze jeden uzel daného klasifikačního stromu. Graficky je tento uzel znázorněn jako jistý druh sloupcového grafu uspořádaného do kruhu (lze se setkat i s pojmem pavučinový graf), kde kaţdý sloupec představuje podkategorii stromu v daném uzlu, kterou lze ohodnotit čísly 1-5. Zároveň se na pravé straně zobrazuje textový popis k tomuto uzlu, tj. názvy kategorie a Obrázek 1: Část klasifikace ACM podkategorií. Aby měl uţivatel přehled o ohodnocení přímo nadřazených kategorií, jsou v levé části komponenty vykresleny malé grafy příslušné všem přímo nadřazeným kategoriím. Vizualizace OP je velmi přímočará, zobrazuje se pouze to, co uţivatel specificky naklikal, nikoliv např. agregace hodnocení podkategorií do nadřazené kategorie. Tento minimalistický přístup má svá pro a proti např. ohodnocení pouze podkategorií bez nutnosti hodnocení nadřazené kategorie můţe slouţit k defenzivnímu hodnocení, kdy si tvůrce profilu je jist jistým specifickým podoborem, ale netroufá si hodnotit nadřazený, širší podobor. Na druhou stranu nerozpoznáme nadřazenou kategorii, kterou uţivatel pouze zapomněl ohodnotit. Zde je jistě prostor k diskusi jak SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 261
Vojtáš, Pokorný, Skopal, Nečaský, Matoušek, Kubalík, Šíma, Ţák, Víta, Novotný, Maryška vizualizaci a editační funkce vylepšovat, nicméně na datový typ OP tyto změny nebudou mít vliv. Zmíněný příklad zadávání znalostí vědce je zobrazen na obrazovce s komponentou pro editaci profilů (vpravo). Obrázek 1 ukazuje jednu kategorii z kořenové úrovně a jednu podúroveň s dalšími podúrovněmi. V současné době je moţné editor OP jiţ prakticky vyzkoušet 3. 2.2 Interpretace OP a vyhledávání Zatím jsme OP popsali pouze jako datový typ a jeho vizualizaci bez bliţší motivace jeho uplatnění. Obecně předpokládáme pouţití OP v mnoha aplikacích, a to jak v rámci portálu, tak mimo něj. Primárně lze OP pouţít jako nástroj k popisu odbornosti nějaké existující entity. Entitou máme na mysli konkrétní osobu studující/pracující v ICT, ICT studijní program, konkurs na ICT pozici ve firmě, téma diplomové práce, výzkumný tým apod. Ke všem těmto entitám lze přiřadit jejich OP, a to jak objektivně, tak mnohokrát subjektivně, jako hodnocení uţivateli. Dále lze OP pouţít k hodnocení odbornosti dané entity, pro kterou jiţ existuje referenční OP. Můţeme například definovat OP popisující, které další odbornosti by entita (např. studijní program) měla obsahovat vzhledem k referenčnímu OP. Nebo můţeme význam stupnice OP obrátit a negativně reagovat na referenční OP, tj. stupně hodnocení by pak znamenaly 0 nekomentuji, 1 téměř souhlasím, 5 zcela nesouhlasím. V obou případech lze OP pouţít jako nástroj ke sběru informací, resp. zpětné vazby od uţivatelů. Co s nasbíranými OP? Uvaţujeme dvě moţnosti, které jsou nyní stále předmětem diskuse. První je statistické zpracování OP a vizualizace resp. agregace více OP do jednoho reprezentativního. Druhou je vyhledávání podobných OP (jiţ uvnitř portálu). Aţ s touto druhou funkcí se význam OP projeví naplno, neboť se s ní částečně naplní představy o Sémantickém webu. Sémentický web původně sliboval vyhledávání v plných textech podle významu, tj. realizovat strojové porozumění informacím na webu. To se však zatím ukazuje jako cíl obtíţně realizovatelný bez pomoci samotných tvůrců či uţivatelů webových stránek. Vyhledávání pomocí OP je sice oproti Sémantickému webu úţeji zaměřené, nicméně reálně vnáší do vyhledávání právě potřebnou sémantiku. 2.3 Případové studie užití odborných profilů V této sekci nastíníme několik příkladových studií naznačujících potenciál odborných profilů v praxi (na portálu). Student Na portálu bude seznam vysokých škol poskytujících studijní programy v informatice a ICT. Zájemce o studium můţe: jednoduše vizualizovat jednotlivé obory pomocí OP a opticky si je srovnat, srovnat obory (nástrojem na portálu) tak, aby viděl, který obor je v čem jedinečný, vyhledat přímo obor, který je nejpodobnější jeho představě (nakliká si vlastní OP). 3 www.sosirecr.cz/forms/sciprof/ 262 SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011
Pokud uţ studuje, můţe si stejným způsobem vybrat téma diplomové práce. Pokud absolvuje jako Bc a nechce pokračovat ve studiu na stávající škole, můţe si vybrat navazující studium na jiné škole na základě svého Bc profilu a poţadavků na Mgr program na jiné škole. Absolvent Na webu existují inzertní servery nabízející nabídky zaměstnání 4. Vyhledávání v těchto inzerátech je ale nepřesné, a vyţaduje opakovaná hledání tak, jak se nabídky objevují. Kategorie zde sice existují, ale jsou příliš hrubé (např. jen ICT). Webový portál SoSIReČR bude rovněţ podporovat inzerci a management lidských zdrojů, nicméně pracovní nabídky v ICT budou popsány (kromě textového popisu) také pomocí OP, coţ absolventovi umoţní velmi přesné vyhledávání. Absolvent nemusí explicitně vyhledávat pozice opakovaným kladením dotazu, stačí, kdyţ si do svého osobního profilu na portálu uloţí svůj OP a přihlásí se k odběru perspektivních pracovních nabídek. Ty by mu v budoucím vývoji portálu mohly podle principů kolaborativního filtrování informací chodit automaticky na základě dostatečné podobnosti OP nabídky s OP absolventa. Akademik /Vědec Ačkoliv vědeckých týmů praktikujících základní výzkum v ICT je v České republice jistě méně neţ ICT firem či studentů, je s podivem, ţe mnohé týmy, které se věnují příbuzné problematice, o sobě neví. Spolupráce vědeckých týmů v ČR stojí spíše na osobních kontaktech neţ na cíleném vyhledávání partnerů. Zde by OP mohly pomoci při hledání partnerského týmu pro základní výzkum. Předpokládejme např., ţe biologická laboratoř potřebuje do svého projektu zapojit pracoviště, které jí pomůţe vyřešit otázky výkonnosti jejich specifických algoritmů. Pomocí odborných profilů zveřejněných jednotlivými týmy můţe laboratoř takové pracoviště najít snáze, neţ zdlouhavým prohledáváním textu na ad-hoc vyrobených webových stránkách konkrétních týmů. Pedagog můţe pomocí OP značkovat svoje předměty, témata diplomových prací, poţadavky na studenty do projektů, apod. Zároveň můţe podobné informace sledovat u svých kolegů a srovnávat je. Garanti studijních programů na fakultách mohou sledovat profilaci různých ICT programů v rámci ČR a reagovat na poptávku ze strany studentů i firem. Firma Podobně jako absolvent hledá práci pomocí OP, můţe ICT firma, resp. její personální oddělení, vyhledávat vhodné zájemce o práci. Místo tradičního pořádání konkurzů, kterými 90% zájemců neprojde, si můţe firma vytipovat na portálu ty zájemce o práci, kteří se ohodnotili OP odpovídajícím představě firmy. Na osobní pohovor pak firma pozve řádově méně kandidátů, protoţe těch zcela nevhodných se zbavila jiţ před výběrem na portálu. Pochopitelně ţe firma můţe vyhledávat pouze v takovém seznamu osob, které explicitně zveřejní svůj OP a dají tak souhlas k jeho publikaci. Dalším uţitečným nástrojem pro firmy je hledání akademického partnera pro aplikovaný výzkum zde je situace obdobná jako v případě hledání partnera pro základní výzkum, viz výše. V současné době se taková firma musí spolehnout na webový vyhledávač à la Google a ad hoc vytvořené stránky výzkumných týmů, případně si zaplatit sluţbu (nebo státní agenturu), která to udělá za ni. Pokud budou mít výzkumné týmy svoje OP zveřejněné na portálu, vyhledávání partnera pro výzkum se tím zjednoduší. 4 např. www.jobs.cz SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 263
Vojtáš, Pokorný, Skopal, Nečaský, Matoušek, Kubalík, Šíma, Ţák, Víta, Novotný, Maryška V neposlední řadě mohou s podporou OP zahájit firmy věcný dialog s vysokými školami. Z hlediska hodnocení absolventů jsou to právě firmy, které vidí, zda je absolvent pouţitelný v komerční praxi lépe či hůře. Pokud mají firmy negativní zkušenosti s absolventy ve stále stejných kritériích, mohou poukázat na nedostatky ve studijních programech jednotlivých fakult a samy pomocí OP specifikovat vlastní představu o odborném profilu absolventa. Školám taková zpětná vazba jistě poskytne uţitečnou informaci o poptávce po ICT vzdělání v konkrétním regionu. 3. Portál 3.1 Základní entity portálu Základní entity portálu jsou navrţeny tak, aby bylo moţné naimplementovat všechny poţadované funkčnosti portálu na podporu sběru, zpracování a zobrazování informací o lidech, institucích, studijních oborech, projektech a jiných aktivitách v oblasti ICT v regionech ČR [4]. V termínech jayzka UML stojí koncept portálu na třech třídách: Profil, Relace a Informace. Profil je abstraktní třída, která zastřešuje všechny typy entit, které se na portálu prezentují. Kaţdý profil má svoje id, prezentuje soubor informací, je svázán s konkrétním regionem a je ve vztahu s jinými profily. Profil má dva přímé potomky třídy Uţivatel a Skupina. Třída Uţivatel odpovídá profilu jednoho uţivatele portálu. Třída Skupina je mnoţina uţivatelů (potomky této třídy jsou například třídy Firma, Instituce, Projekt), rozšiřuje třídu Profil tím, ţe je ve vztahu se svými členy. Kaţdý profil obsahuje povinný atribut Region působnosti. Pro výběr regionů a lokalit působnosti u jednotlivých profilů je vyuţita databáze územních celků Územně identifikačního registru adres [6]. Tyto informace se vyuţívají při získávání a zobrazování souhrnných informací o regionech. Relace představuje typy vztahů mezi dvěma profily. Sem patří například typ vztahu být známým dvou uţivatelů, vztah nadřízená podřízená skupina (např. oddělení ve firmě nebo fakulty na univerzitě), aj. Informace reprezentuje, zjednodušeně řečeno, dvojice (název, hodnota). Kaţdá informace je svázána s profilem, který ji prezentuje, přičemţ tato vazba můţe být dvojího typu. Prvním je tzv. obecně definovaná informace, tedy informace, která je společná všem instancím daného typu profilu (např. kaţdá firma má IČ). Druhým typem je pak uţivatelsky definovaná informace, která umoţňuje, aby si například uţivatel mohl vloţit na svůj profil další informace svého vlastního typu. 3.2 Hlavní komponenty portálu Architektura portálu zahrnuje tyto o hlavních částí: webový modul, modul perzistence dat, modul pro práci s RDF, ontologií a pro sémantické vyhledávání, modul komunikačních prostředků uţivatelů a modul pro archivaci dat. Modul perzistence dat zajišťuje trvalé uloţení dat aplikace. Skládá se z komponent: 264 SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011
pracovní relační databáze zajišťuje vlastní uloţení dat a zpracování dotazů nad daty. Pouţita je relační databázová technologie s rozhraním podporujícím jazyk SQL; objektově-relační mapování převádí data z databáze na objekty jazyka Java a zpět. Webový modul tvoří jádro aplikace, obecně je navrţen podle návrhového vzoru Model- View-Controller (MVC) a obsahuje tyto komponenty: aplikační logika (C) zajišťuje zpracování poţadavků z prohlíţeče uţivatelů; výstup do prohlíţečů uţivatelů (V), který na základě informací z aplikační logiky vygeneruje odpovídající (X)HTML výstup a odešle ho uţivateli k zobrazení (součástí této komponenty je i podpora pro interaktivní uţivatelské rozhraní v prohlíţeči uţivatele); komponenta zajišťující perzistenci dat v databázi (M) je přirozeně součástí modulu perzistence dat. Modul pro práci s RDF, ontologií a pro sémantické vyhledávání slouţí pro převody dat ve formátu RDF [7] ve struktuře odpovídající ontologii navrţené pro portál. Obsahuje funkce podporující pokročilé sémantické vyhledávání, dále pak pro import a export RDF dat. Modul komunikačních prostředků uţivatelů obsahuje dvě komponenty umoţňující vzájemnou komunikaci mezi registrovanými členy portálu, uţivatelský blog a diskusní fórum. Diskusní fórum 5 jiţ bylo zřízeno na začátku řešení projektu a je zaintegrováno do portálu spolu se svými dosavadními uţivateli. Diskusní fórum umoţňuje zakládat jak globální diskusní vlákna přístupná všem členům portálu, tak skupinová, přístupná pouze členům dané skupiny. Modul pro archivaci dat pak zodpovídá za uchování historie úprav provedených na portálu. Vývoj portálu probíhá postupně po iteracích. První prototyp portálu se základními funkcemi umoţňujícími zakládání profilů osob a skupin, vyplňování odborných profilů a základní vyhledávání v profilech a odborných profilech bude představen v polovině roku 2011. Následně bude portál doplňován o další funkčnosti, jako jsou zadávání inzerátů, sběr a zpracování dat týkajících se studijních oborů, rozšířené vyhledávání v odborných profilech a sémantické vyhledávání v datech RDF. Předpokládáme, ţe další poţadavky na uţitečné funkce také postupně vzejdou od samotných uţivatelů. 4. Informatický výzkum a vývoj Cílem této části projektu je vytvořit rámec pro diskuse o důleţitých otázkách informatického výzkumu a informatiky vůbec, které probíhají neformálně na nejrůznějších akademických fórech, a v komunikaci s hospodářskou sférou a státní správou jim dát formu a tvář pochopitelnou široké veřejnosti. Chtěli bychom tak přispět ke zlepšení prostředí informatického výzkumu a k akceleraci rozvoje jak akademické sféry, tak hospodářského odvětví spjatého s informatikou. V rámci této aktivity jsme se v roce 2010 prostřednictvím ÚI obrátili na mezinárodně respektované osobnosti české informatiky, kteří většinou zastávají vysoké akademické funkce, příp. mladší perspektivní výzkumníky, kteří budou s velkou pravděpodobností ovlivňovat prostředí informatického výzkumu v budoucnosti, se ţádostí, aby vypracovali 5 http://www.sosirecr.cz/mybb/ SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 265
Vojtáš, Pokorný, Skopal, Nečaský, Matoušek, Kubalík, Šíma, Ţák, Víta, Novotný, Maryška studie na jimi zvolená témata, která povaţují za důleţitá pro informatickou komunitu a která jsou jim profesně blízká. V první roční etapě šlo o studie, které by zmapovaly problematiku na základě zkušeností autorů včetně jejich vlastních postojů a názorů, artikulovaly otázky, vytipovaly a definovaly důleţité problémové okruhy, které si zaslouţí další podrobnější analýzu, příp. zváţily moţnosti jejich medializace. Výsledkem je 10 tématických studií, jejichţ hlavní myšlenky byly představeny a diskutovány spolu s recenzemi na 1. semináři z cyklu "Hovory s informatiky" v červnu 2010 v Praze, kterého se zúčastnilo cca 100 informatiků z celé České republiky. Finální verze těchto studií byly publikovány ve sborníku [2], který byl k dispozici na 2. semináři z uvedeného cyklu v říjnu 2010 v Mikulově, jenţ prostřednictvím panelové formy vytvořil větší prostor pro otevřenou diskusi všech účastníků z řad informatické komunity. V prvním roce projektu tak vykrystalizovaly tři klíčové tematické oblasti, které budou v roce 2011 předmětem podrobné analýzy: Hodnocení a financování informatického výzkumu Spolupráce s ICT firmami v rámci informatického výzkumu a vzdělávání Společenský, kulturní, vzdělávací a regionální kontext informatiky Za tímto účelem byly konstituovány tři pracovní skupiny, v jejichţ středu jsou autoři a recenzenti předchozích studií. Výstupem jejich činnosti by kromě detailní analýzy konkrétních problémů měly být i návrhy doporučení a iniciativ s alternativními řešeními, příp. návrhy prohlášení a výzev. Adresátem těchto dokumentů by měla být nejen informatická komunitu, ale i státní správa a hospodářská sféra. Vybrané výsledné dokumenty budou publikovány v dalším ročníku sborníku studií a jejich hlavní myšlenky budou představeny na 3. semináři z cyklu "Hovory s informatiky", který plánujeme koncem října 2011. Dalším důleţitým výstupem by měly být náměty a články pro média, které by mohly podpořit navrhované změny. Za tímto účelem byla uzavřena smlouva s mediální agenturou AMI Communications, spol. s r.o., jejímţ prostřednictvím bude informována široká i odborná veřejnost o aktivitách a výsledcích celého projektu. Podpůrnou aktivitou realizovanou týmem z ÚI je sběr dat o informatickém výzkumu pro potřeby vyvíjeného portálu. Cílem této aktivity je mapovat informatické prostředí zejména v oblasti akademických institucí působících v informatice a aktivit na pomezí akademické a komerční sféry. V rámci této aktivity byl vytvořen detailní seznam všech informatických pracovišť na akademické půdě ať uţ na VŠ či na ústavech AV ČR aţ na úroveň pracovních týmů či odborných skupin doplněný o nejrůznější data (od kontaktních, přes geolokační aţ po klasifikační podle ACM). Klíčovým aspektem našeho přístupu je integrování nejrůznějších dostupných datových zdrojů (např. seznamy informatických pracovníků na jednotlivých informatických katedrách se záznamy z databáze DBLP [5]). Výsledkem této činnosti by měly být kolekce dat, které jsou v současné době roztroušeny na nejrůznějších webových stránkách, coţ znemoţňuje efektivní práci s nimi. Shromaţďujeme především data o těchto entitách: instituce (VŠ, v.v.i., firmy) v ČR na úrovni informatických kateder, oddělení a výzkumných týmů; informatičtí výzkumní pracovníci v ČR; informatické společnosti; informatické obory (vyšší úrovně ACM klasifikace); prestiţní oborové informatické konference a časopisy; zavedené národní informatické semináře; knihovny a informační zdroje o informatice; poskytovatelé informatických grantů v ČR, EU, USA; informatické projekty a záměry (odkazy do CEP); velké vývojové softwarové projekty; profesní diskusní skupiny; vývěsky s inzercí odborných akcí, zájmu o výzkumnou spolupráci atd. Svým rozsahem a formou se bude jednat o informace, které pokrývají standardní informační potřeby akademických 266 SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011
pracovníků v oblasti informatiky a téţ pracovníků ze strany komerčních firem, kteří mají zájem o vyuţití synergií při spolupráci s akademickou sférou. 5. Průzkum znalostí ICT: nabídka VŠ vs. praxe Vysoká škola ekonomická se v rámci projektu SoSiReČR podílí zejména v následujících oblastech: průzkum znalostí ICT, které vyţaduje podnikový sektor po absolventech vysokých škol, průzkum znalostí, které poskytují vysoké školy se zaměřením na ICT svým studentům, kontakty s podnikovou sférou v regionech. Kaţdý z průzkumů lze detailněji charakterizovat takto: 5.1 Průzkum mezi firmami V rámci šetření bylo osloveno celkem 1002 firem. Oslovené firmy byly rozděleny jak podle jejich velikosti, tak i podle sektoru, ve kterém působí a podle geografického umístění. Na základě tohoto členění lze detailně analyzovat poptávku po znalostech, počtech ICT odborníků, a to jak dle velikosti společnosti, tak i podle místa jejího sídla, dále také podle oboru, ve kterém podniká. V rámci šetření byli oslovováni zejména ICT manaţeři podniků. Zjištěné charakteristiky byly prostřednictvím nástrojů pro čištění dat a jejich klasifikaci roztříděny do statisticky významných shluků, které umoţňují potřebnou generalizaci výsledků a jejich následné srovnání s charakteristikami zjištěnými v průzkumu mezi vysokými školami. 5.2 Průzkum mezi vysokými školami V rámci průzkumu mezi vysokými školami bylo osloveno více neţ 81 fakult vysokých škol, na kterých jsou v České republice vyučovány studijní obory. Pro průzkum bylo identifikováno 462 studijních oborů se zaměřením na ICT. Základním datovým zdrojem pro identifikaci pro průzkum zajímavých studijních oborů, tedy těch zaměřených na výuku ICT, byly vstupy z Ústavu pro informace ve vzdělávání, který tato data získává z matriky studentů. S ohledem na skutečnost, ţe zdrojová data z matriky studentů nemusí být přesná, byla kaţdá z oslovených vysokých škol instruována, aby jiţ zaniklé studijní obory označila a stejně tak, aby doplnila případně chybějící studijní obory. Vyjma výše uvedených oblastí zkoumání byly rozšířeny datové vstupy i o počty studentů v ICT studijních oborech, jejich úspěšnost v rámci studia a další kvantitativní ukazatele umoţňující vytvořit predikce pro budoucí období. Délka zkoumaného období je od roku 2001 do roku 2010. 5.3 Propojení průzkumů Na základě obou průzkumů bylo provedeno porovnání: zda nabídka počtů absolventů odpovídá poţadavkům poptávky po absolventech, SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 267
Vojtáš, Pokorný, Skopal, Nečaský, Matoušek, Kubalík, Šíma, Ţák, Víta, Novotný, Maryška zda znalosti absolventů odpovídají znalostem, které poţaduje podnikový sektor, jak se vyvíjí poptávka po ICT odbornících, jak se vyvíjí nabídka ICT odborníků, jaký je trend ve vývoji znalostí absolventů. Výše zmíněná zjištění se stanou jedním ze základů znalostní báze budované sociální sítě. Na základě výsledků z obou průzkumů budou dále poskytovány individuální analýzy dat podle poţadavků členů sociální sítě. Tyto mohou slouţit například pro úpravu struktury analyzovaných studijních oborů tak, aby jejich absolventi lépe odpovídali poţadavkům podnikové praxe. Rovněţ budou identifikovány podniky, jejichţ ICT zaměstnanci by se mohli stát členy vznikající sociální sítě, připravujeme rozvněţ rozsáhlou informační kampaň pro jejich získání. Souběţně jsou také organizovány regionální workshopy, na kterých jsou představovány regionální výsledky průzkumů poptávky a nabídky po ICT odbornících a diskutována témata spojená se spoluprací akademické a soukromé sféry v daném regionu. 6. Závěr Protoţe oficiální horizont projektu je konec října roku 2012, týkají se nejbliţší plány dokončení portálu a praktické ověřování jeho moţností. Protoţe jde o realizaci sociální sítě, je jakékoliv ověřování portálu závislé na jeho uţivatelích, tj. na jejich aktivitě konstruovat a zveřejnit svůj profil. To samé platí i o dotazování např. ze strany firem hledajících pracovníky do odborných týmů apod. Jedině reálným pouţíváním portálu a s tím spojeným rozšiřováním jeho znalostní báze lze ověřit jeho funkčnost a pouţitelnost. Proto jsou důleţitou součástí projektu další aktivity, jako je šíření informací o projektu v regionech spojené se zapojováním zájemců - budoucích uţivatelů sítě do projektu. Projekt SoSIReČR realizuje, byť pouze v malém, v oblasti ICT to, čemu se dnes říká Sociální web. Připomeňme, ţe Sociální web není totéţ co Sémantický web, pouze vyuţívá některé jeho technologie. Cílené naplňování znalostní báze profily s jednoduchou klasifikací a ohodnocením v pozadí tvoří dobrou platformu pro budování jistého systému kolektivní inteligence [1], a to nikoliv všeobjímající moudrosti davu, nýbrţ znalostí týkající se jedné, přiměřeně velké a dost vyhraněné komunity informatiků. 7. Literatura [1] GRUBER, T.: Collective Knowledge Systems: Where the Social Web meets the Semantic Web. In: Prof. of Web Semantics: Science, Services and Agents on the World Wide Web (2007), 19 p. [2] KLÍMOVÁ, H., KUŢELOVÁ, D., ŠÍMA, J., WIEDERMANN, J., ŢÁK, S. (Eds.): Hovory s informatiky 2010, Ústav informatiky AV ČR, Praha, 2010. http://www.cs.cas.cz/sosirecr/sbornik/ [3] MATOUŠEK, K., DOLEŢAL, J., DOLEŢEL, J., KUBALÍK, J., NEČASKÝ, M.: Analýza portálu pro podporu sítě informatiků v ČR, Hovory s informatiky, 2010. [4] NEČASKÝ, M.: Analýza potřeb členů sociální sítě informatiků v regionech ČR. Zpráva projektu SoSIReČR, 2011. 268 SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011
[5] The DBLP Computer Science Bibliography. http://www.informatik.unitrier.de/~ley/db/ [Online; navštíveno 9.4.2011] [6] UIR-ADR: Popis dat struktury 4.2 poskytovaných uţivatelům. http://forms.mpsv.cz/uir/dokum/popisdat42.zip. [Online; navštíveno 1.10.2010] [7] W3C: Resource Description Framework (RDF). http://www.w3.org/rdf/ [Online; navštíveno 9.4.2011] SYSTÉMOVÁ INTEGRACE 2 - PŘÍLOHA/2011 269