Datové sklady ve školství aneb evaluace procesu výuky jinak Jana Šarmanová
Obsah Business Intelligence a školní výuka Databáze a datové sklady Analýza datového skladu Studie DS pro studijní agendu VŠ Studie DS pro třídní knihu a žákovskou knížku Motto: Data prozradí všechno aneb nejen v Čechách se nic neutají Studie DS pro protokolování e-learningové adaptivní výuky ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 2
Business Intelligence a škola Business Intelligence soubor metod a SW nástrojů, pomocí nichž se ze zdrojových databázových informací získají informace nové, poskytující svému uživateli analýzy dat ze všech možných hledisek; umožní tak především managementu lepší rozhodování o řízení své organizace odtud citovaná záruka prosperity, komerční úspěch; speciální oblast na rozhraní databázové technologie, managementu, umělé inteligence. Z hlediska škol možné základní využití z hlediska hospodaření, odhalování rezerv apod.; možné i využití v základní oblasti školy využitím informací o procesu výuky s možností její proces i kvalitu usměrňovat; jedno z možných a dosud nevyužívaných využití ICT ve vzdělávání. ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 3
Databáze a informační systémy Databáze DB a informační systémy IS databáze je množina tabulek, evidujících informace (vlastnosti či atributy) o evidovaných objektech (entitách) z nějaké oblasti našeho zájmu (tabulky Studentů, Předmětů, Učitelů, Rozvrhu, Zkoušek,...); automatizovaný informační systém je soubor počítačových programů, které umožňují s databází pracovat; ukládat do ní data, provádět s nimi výpočty, třídění, výběry, tisknout a formátovat potřebné výstupy; evidují data, provádějí každodenní operace transakce s jednotlivými záznamy, proto transakční databáze a celý proces je nazýván OLTP (On-Line Transaction Processing); uchovávají se aktuální data, stará data se archivují a dále příliš nevyužívají; dle hesla: kdo nezná svou historii, musí ji prožít znovu - v archivech je mnoho informací, které by mohly být užitečné i pro budoucnost; formální problém je často v historicky různých IS, formátech dat, vyplňování dat,... a odtud informací velmi obtížně zpracovatelných. ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 4
Datové sklady Datové sklady DS a systémy pro podporu rozhodování DSS pro zpětné analýzy už nejsou důležité jednotlivé entity, ale jejich agregované statistické údaje o počtech, sumách, průměrech apod.; potřebné údaje nejsou vždy převídatelné a proto nejsou naprogramovány, jako funkce u IS... odtud nový problém, jak data uchovávat a jak zpracovávat, aby byly snadno a rychle dosažitelné potřebné informace; geniální nápad amerického matematika a databázisty W. H. Inmona : rozdělit atributy na ty, které jsou sumovatelné (fakty), ty, podle nichž se sumuje (dimenze), ostatní popisné (atributy), spočítat všechny teoreticky možné agregace předem, navrhnout nový systém jednoduše umožňující výběr aktuálně potřebných informací - systém OLAP (On-Line Analytical Process) ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 5
Analýza a návrh datového skladu Příklad 1: Studijní agenda VŠ zdrojová data Student (id_stud, jmeno_stud, fakulta, obor, rocnik, ) Predmet (id_pred, nazev_pred, obor, rocnik, semestr, special, typ_pred, kredity, ) Ucitel (id_ucit, jmeno_ucit, fakul, katedra, ) Zapis (id_zapis, id_stud, id_pred, dat_zapis, dat_zkous, body_zkous, znam_zkous) Zkouska (id_zkous, id_zapis, id_ucit, ter_zkous, pokus, body_zkous, znam_zkous) Ukol (id_ukol, id_zapis, id_ucit, popis_ukol, ter_ukol, pokus, body_ukol) Rozvrh (id_rozvrh, id_pred, id_skup, id_ucit, id_mistn, id_cas, typ_vyuky) ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 6
Analýza a návrh datového skladu Příklad 1: Studijní agenda VŠ motivace pro datový sklad Student (id_stud, jmeno_stud, fakulta, obor, rocnik, ) Predmet (id_pred, nazev_pred, obor, rocnik, semestr, special, typ_pred, kredity, ) Ucitel (id_ucit, jmeno_ucit, fakul, katedra, ) Zapis (id_zapis, id_stud, id_pred, dat_zapis, dat_zkous, body_zkous, znam_zkous) Zkouska (id_zkous, id_zapis, id_ucit, ter_zkous, pokus, body_zkous, znam_zkous) Ukol (id_ukol, id_zapis, id_ucit, popis_ukol, ter_ukol, pokus, body_ukol) Rozvrh (id_rozvrh, id_pred, id_skup, id_ucit, id_mistn, id_cas, typ_vyuky) Možné zajímavé analýzy: počty předmětů, studentů, zkoušek a pokusů, úkolů a pokusů, hodin výuky na učitele/katedru/obor/ročník/fakultu celkem, ročně, týdně, denně, průměr, min, max bodů a známek na předmět/učitele/katedru ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 7
Analýza a návrh datového skladu Příklad 1: Studijní agenda VŠ struktura datového skladu F_Ukol (id_ukol,id_stud, id_pred, id_ucit, id_datum, id_pokus, pocet_ukol, body_ukol) F_Zkouska (id_stud, id_pred, id_ucit, id_datum, id_pokus, počet_zkous, prum_ body_zkous, prum_znam_zkous, kredity) F_Rozvrh (id_cas, id_mistn, id_pred, id_ucit, id_typ_vyuky, id_skup, počet_hodin) ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 8
Využití datového skladu Příklad 1: Datový sklad studijní agendy VŠ Tabulky (grafy) s výsledky zkoušek (počet zkoušek, průměr bodů, známek,...) podle předmětů (i dlouhodobé, bez ohledu na učitele, akad_rok,...), vyučujícího učitele (bez ohledu na předmět,...), zkoušejícího učitele, studentů, pořadí pokusu zkoušky, datumu výuky, zkoušky dne v týdnu, dne ve zkouškovém,... času výuky, zkoušky ráno, dopoledne, odpoledne,... výukové, zkušební místnosti,... libovolných kombinací těchto parametrů. Obdobné analýzy úkolů (domácích, projektů,...), rozvrhu,... Zajímavé či podezřelé mohou být všechny odchylky od normálního rozdělení. ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 9
Využití datového skladu příklad analýz VŠ Příklad 1: rozložení známek všech předmětů za posledních 10 let 4500 4000 3500 3000 2500 2000 1500 1000 500 0 1 2 3 4 rozložení známek všech předmětů za první / poslední 2 roky 1200 1000 800 600 400 200 0 1 2 3 4 500 400 300 200 100 0 1 2 3 4 ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 10
Využití datového skladu příklad analýz VŠ Příklad 1: rozložení známek po předmětech (3) za posledních 10 let 350 př1... přísný 300 250 př2... přísný 200 př1 př3... velmi tolerantní 150 př2 ----- 100 př3 př1... velmi ubral požadavky 50 0 př2... přísný stejně 1 2 3 4 př3... tolerantní stejně rozložení známek po předmětech za první / poslední rok 40 35 30 25 20 15 10 5 0 1 2 3 4 př1 př2 př3 40 35 30 25 20 15 10 5 0 1 2 3 4 př1 př2 př3 ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 11
Využití datového skladu příklady analýz SŠ Příklad 2: Třídní kniha a žákovská knížka Možné zajímavé analýzy: o výsledcích žáků nejen aktuální, ale i zpětně, po předmětech, učitelích,..., podle váhy, dne, hodiny,... o absencích a omluvenkách žáků podle předmětů, dnů, hodin,... o vytížení učitelů výukou, suplováním, inspekcemi,..., podle dnů, hodin,...,podle počtu hodin s výkladem, počtu zkoušení, písemek,..., o výsledcích učitelů za předmět,... ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 12
Využití datového skladu e-l Příklad 3: Protokol z (adaptivní) e-learningové výuky Student (id_student, login, heslo, pohlavi, jmeno, prijmeni, dat_nar, vek, typ_studia, obor, rocnik, Sver, Sviz, Saud, Skin, MStSoc, MStAfekt, MStSyst, MStTeor, MStExp, MStDetail, MStHol, MStHloub, MStAutoreg). Výuková opora ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 13
Využití datového skladu příklady e-l Příklad 3: Protokol z (adaptivní) e-learningové výuky ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 14
Využití datového skladu příklady e-l Příklad 3: Protokol z (adaptivní) e-learningové výuky Možné zajímavé analýzy: doba strávená nad jednotlivými vrstvami výkladovými, testovacími, počty přechodů na další vrstvu doporučených systémem / na jinou vrstvu, var, rámec počty správných / nesprávných odpovědí na testovací otázky a úkoly, rozdíly ve výsledcích odpovědí ve výuce, autotestech, testech, ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 15
Využití datového skladu příklady e-l Příklad 3: Protokol z (adaptivní) e-learningové výuky ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 16
Děkuji za pozornost ICTE 2013 Rožnov pod Radhoštěm 10.-12.9.2013 17