Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ VŘ: zakázka malého rozsahu Druh zakázky: zakázka na dodávky Druh řízení: otevřená výzva Způsob provedení VŘ: prostřednictvím el. tržiště Předpokládané datum zahájení VŘ: 17. 9. 2013 Předpokládané datum ukončení VŘ (doručení nabídek): 3. 10. 2013 Předpokládané vyhodnocení VŘ: 4. 10. 2013 Předpokládané datum dodání předmětu plnění (licence): 31. 10. 2013 Kvalifikační předpoklady uchazeče: žádné Způsob oslovení uchazečů: otevřené VŘ v rámci systému el. tržiště současně s přímým oslovení IT firem dle typu činnosti (prodej SW a příbuzné obory) počet v řádu set firem Hodnotící kritéria: cena 100% Kontaktní osoba: Kamil Melichárek Požadavky k doložení (povinné přílohy): Jednostranně podepsaná kupní smlouva s přílohou, která bude obsahovat popis funkčností a modulů nabízeného systemu s detailním položkovým rozpočtem, detailní popis licenčního modelu vztahujícího se k nabídce včetně všech omezení a výjimek. Další požadavky plnění: Termín dodání licencí do 31. 10. 2013 Předmět plnění: Předmětem plnění je dodávka multilicence (pro celou organizaci) k užití SW pro statistické zpracování dat. Tato multilicence bude sloužit všem určeným uživatelům organizace, přičemž podmínkou je, že licenční ujednání nesmí vázat užití licence nebo její části na konkrétní HW nebo konkrétní uživatele. Okruh potenciálních uživatelů je cca 30 osob, které se mohou v čase měnit (se zachováním tohoto maximálního počtu) a celá skupina může být i rozšířena, přičemž nabízený způsob licencování nesmí tyto záměry nijak omezovat. Požaduje se tedy licence buď zcela neomezená na počet uživatelů celkem
nebo alespoň licence omezující pouze počet uživatelů užívajících daný produkt nebo modul současně v daném okamžiku (bez vazby na jméno uživatele nebo HW prostředek, na kterém bude SW provozován). Samotný SW nebo jeho moduly tedy musí splňovat níže uvedené požadavky na funkčnosti a zároveň musí být zajištěno využití tohoto SW nebo jeho části uvedeným množstvím uživatelů, přičemž obecně (ne nutně současně v daný okamžik) můžou být tyto části užívány neomezeným množstvím uživatelů (s neomezeným množstvím reálných instalací). Pokud tedy pro pokrytí těchto potřeb není možné nabídnout zcela neomezenou licenci (co do počtu uživatelů organizace), je nutné zajistit alespoň možnost konkurentního využití uvedeným množstvím uživatelů. Akceptovatelným omezením výše pospaných licenčních podmínek je situace, kdy uživatel využívá po přechodnou dobu systém nebo jeho moduly v režimu offline (konkrétně např. na služební cestě) tzn. mimo síť ČŠI, ve které je uplatněno sledování aktuálně využitých licencí. Pro takové situace je přípustné snížení počtu licencí k současnému využití (online uživatelé uvnitř sítě ČŠI) o počet licencí, které byly krátkodobě alokovány offline uživatelům. Po přechodu takových uživatelů zpět do režimu online jsou jimi zablokované licence opět uvolněny ke společnému (konkurentnímu) sdílení. Součástí plnění (a nabídkové ceny) je rovněž služba poskytnutí uživatelské podpory a maintenance (upgrade systému a jeho modulů) po dobu minimálně 12 měsíců následujících po dni podpisu kupní smlouvy. Požadavky na funkčnosti systému nebo jeho modulů včetně požadovaného počtu konkurentních uživatelů (v případě, že nebude nabízena zcela neomezená licence) 1. Základní funkčnosti alespoň 9 konkurentních uživatelů Analytický nástroj podporující analytický proces ve všech jeho fázích plánování, sběru dat, analýzy, reportování i předávání výsledků techniky a nástroje pro přípravu a čištění dat vybavení souboru metadaty, informace o seznamu hodnot a počtu jejich výskytů, možnost aplikovat metadata části proměnných na ostatní proměnné v souboru, identifikace duplicitních záznamů a jejich případné odstranění, jednoduchá příprava spojitých číselných dat pro analýzu, možnost vytvořit si vlastní seznam informací o proměnných, možnost otevřít několik datových souborů najednou pro urychlení spojování souborů, restrukturalizace souboru pro potřeby analýzy aj. Tvorba obecně používaných grafů i vlastních grafů v jazyce GPL grafy pro kategorizované proměnné, bodové grafy, grafy distribucí, grafy pro kontrolu kvality, kontrola pravidel pro
sekundární SPC-grafy, diagnostické a explorační grafy, multiple use charts, uživatelsky definované grafy Predikční schopností modelů pomocí Monte Carlo simulací Geografické zobrazení analytických výsledků Tvorba, distribuce a převedení informace do tvaru tabulek pro ad hoc rozhodování. Tabulky, grafy a datové kostky se mohou dále zpracovat technologií kontingenčních tabulek Export výstupů do formátu Microsoft Word, Microsoft PowerPoint, Microsoft Excel, PDF Provádění popisných statistik: přehledy a reporty, codebook, četnosti a první stupeň třídění, popisné statistiky, explorační statistiky, kontingenční tabulky, popisné poměrové statistiky Porovnávání průměrů: průměry v mnohorozměrných tabulkách, One-Way jednoduchá analýza rozptylu (ANOVA), ANOVA jednoduché faktoriální modely Korelace: korelace dvou proměnných, parciální korelace, míry vzdálenosti, proximity, podobnosti/nepodobnosti, Automatic Linear Modeling Automatizace predikce číselné proměnné, lineární regresní analýza, ordinální regrese, simulování, prokládání křivkou, neparametrické testy, mnohonásobné odpovědi Procedury pro redukci počtu dat: faktorová analýza Klasifikace: dvoustupňová seskupovací analýza, hierarchická seskupovací analýza, rychlá seskupovací analýza (K-means), analýza nejbližšího souseda, diskriminační analýza, mnohorozměrné škálování, maticové operace, maticový jazyk 2. Ostatní funkčnosti alespoň 1 konkurentní uživatel Modul pro přesné výpočty P-hodnot pro soubory s malým počtem hodnot nebo pro řídké jevy ve velkých souborech dat při zachování původního designu a přirozených kategorií Testy a statistiky pro analýzu malých datových souborů: Pearsonův chí-kvadrát test nezávislosti, test poměrem věrohodností, Fisherův neparametrický test, test lineární závislosti, kontingenční koeficient, fí (ϕ), Cramérovo V, Goodmanovo a Kruskalovo τ, symetrický a nesymetrický koeficient redukce neurčitosti, kapa (κ), gama (γ), Kendallovo t b a t c, symetrické a nesymetrické Somersovo D, Pearsonův korelační koeficient (r), Spearmanův korelační koeficient (r), McNemarův test, znaménkový test, Wilcoxonův pořadový test, test marginální homogenity, dvouvýběrový Kolmogorov-Smirnovův test, testy pomocí Mann-Whitneyho U nebo Wilcoxonova W, Cochranův Q test, Wald-Wolfowitzův pořadový test, Friedmanův test, Kendallův koeficient konkordance, Kruskal-Wallisův test, mediánový test, Jonckheer-Terpstrův
test, jednovýběrový chí-kvadrát test dobré shody, jednovýběrový Kolmogorov-Smirnovův test dobré shody, jednovýběrový Wald-Wolfowitzův pořadový test, binomický test Modul zajišťující zlepšení přípravy dat a získání přesnějších výsledků Identifikace podezřelých nebo chybných případů, proměnných a hodnot Zobrazení struktury vynechaných hodnot Prověření rozložení proměnných Práce s algoritmy navrženými pro nominální znaky Minimálně 4 procedury: o Validate Data eliminace manuální kontroly dat, standardizovaný proces přípravy dat díky zavedení kontrolních mechanismů pro všechny typy proměnných možnost zavést pravidla pro jednotlivé proměnné i pro vztahy mezi nimi. Výstupem je zpráva o neplatných případech, přehledy o porušení pravidel a informace o četnosti případů porušení pravidel. o Automatická příprava dat odhalení a oprava kvalitativních chyb dat, zároveň imputace chybějících hodnot. Výsledkem jsou doporučení a grafy. o Identifikace neobvyklých případů hledání odlehlých hodnot ve vícerozměrných datech, zabraňuje zkreslení závěrů. Výstupem je informace o neobvyklých případech i zdůvodnění jejich označení jako anomálních případů. o Optimální kategorizace rozděluje stupnice spojité proměnné do intervalů pro funkční použití algoritmů navržených pro nominální proměnné. Jsou možné tři typy dělení nesupervizované, supervizované, smíšený přístup. Modul pro zajištění stability a spolehlivosti modelů díky spolehlivým odhadům směrodatných chyb a intervalů spolehlivosti pro populační parametry jako je průměr, medián, podíl, poměr šancí, korelační koeficient, regresní koeficient aj. Provádění opakovaných výběrů s vracením pro určení variability odhadů Odstranění odlehlých a netypických pozorování Modul pro odhalení skrytých vazeb v kategorizovaných datech díky percepčním mapám, optimálnímu škálování a technikám redukce počtu dimenzí Možnost regresní analýzy pro všechny typy proměnných, vizuální výstupy pro interpretaci dat a sledování asociací řádkových a sloupcových kategorií v rozsáhlých nebo přehledných dvou i vícerozměrných tabulkách četností Možnost zjistit vztahy v ordinálních a nominálních datech pomocí klasické lineární regrese, metody hlavních komponent nebo metody kanonických korelací
Možnost pracovat s rezidui s nenormálním rozdělením nebo s nelineárními vztahy mezi závislou a nezávislou proměnnou, dává možnost využít hřebenovou regresi, metodu Lasso a Elastic Net, možnosti výběru proměnných a modelu pro číselná i kategorizovaná data Využívá biplotů a triplotů pro zjištění vztahu mezi případy, kategoriemi a proměnnými nebo jejich sadami Znázornění podobností mezi dvěma skupinami případů pomocí vzdáleností v percentuálních mapách Pro odhalení významu vztahů možnost využití procedur: kategorická regresní analýza, korespondenční analýza, mnohorozměrná korespondenční analýza, kategorická analýza hlavních komponent, nelineární kanonická korelační analýza, mnohorozměrné škálování, preferenční škálování. Modul pro rychlé a jednoduché vytváření tabulek Náhled tabulek při jejich vytváření Dodatečné úpravy finálních verzí tabulek Export tabulek do Word, Excel, PowerPoint, HTML, PDF a textového formátu Automatizace často používaných reportů Vyzdvihnutí potenciálních příležitostí nebo problémových oblastí pomocí statistických testů chí-kvadrát test nezávislosti pro kategorizované proměnné a pro proměnné vícenásobných odpovědí, t-testy pro průměry a z-test pro párové komparace sloupcových četností v tabulce Identifikace trendů, změn a hlavních rozdílů v datech Sumární statistiky pro kategorizované proměnné a vícenásobné odpovědi počty a široké spektrum procentuálních statistik (řádková a sloupcová procenta, celková procenta, procenta platných pozorování aj.), sumární statistiky pro spojité proměnné průměr, medián, modus, percentily, sumy, směrodatné odchylky, rozpětí, minima, maxima. Modul zajišťující analýzu výsledků komplexních výběrových šetření korektním způsobem Výpočet odhadů s jejich standardními chybami i v komplikovaných designech komplexních výběrů Realizace výběrového designu a příprava pravidel pro zpracování Nástroje pro práci s komplexními výběry: intuitivní názorný průvodce, průvodce pro analýzu dat, predikce numerických výstupů pomocí obecných lineárních modelů, predikce ordinálních výstupů pomocí ordinální regrese, predikce kategorizovaných výstupů pomocí logistické regrese, predikce délky života pomocí Coxovy regrese Práce se stratifikovaným výběrem, skupinkovým výběrem a vícestupňovým výběrem K dispozici online help systém, interaktivní nápověda, případové studie, výukový program
Výpočet korektních bodových odhadů statistiky jako jsou součty, průměry a poměrové ukazatele, výpočet standardních chyb těchto statistik, korektní intervaly spolehlivosti a testy hypotéz, predikce číselných proměnných, predikce ordinálních proměnných, predikce kategorizovaných proměnných, predikce délky života Dostupné procedury, které nabízejí minimálně: o prostředí pro specifikaci výběrového designu a analýz o realizaci komplexních pravděpodobnostních výběrů z populace, vybírá případy podle designu definovaného předcházející procedurou o odhady - průměry, součty, podíly a počítá jejich standardní chyby, efekty designu, intervaly spolehlivosti a provádí testování hypotéz na základě výběrových dat. Při odhadu variability bere v úvahu design, podle kterého byl výběr proveden o vytváření tabulek četností a kontingenčních tabulek včetně standardních chyb, efektů designu, intervalů spolehlivosti a testů hypotéz pro komplexní výběry. Procedura odhaduje variabilitu na základě použitého designu a metod výběru, vytváří tabulky také pro dílčí populace. o modely lineární regrese, analýzy rozptylu, analýzy kovariance pro výběry provedené pomocí komplexních výběrových metod. Odhaduje variabilitu na základě použitého designu a metod výběrů, poskytuje analýzy pro subpopulace. o regresní analýza binární nebo ordinální závislé proměnné s využitím zvolené kumulativní funkce spojení pro komplikované designy komplexních výběrů. Odhaduje variabilitu na základě použitého designu výběru, poskytuje analýzy pro subpopulace. o provádění binární a multinomické logistické regresní analýzy pro data získaná komplexními výběrovými metodami, odhaduje variabilitu na základě použitého designu a metod, poskytuje analýzy v subpopulacích. o aplikace Coxovy regrese proporcionálního rizika na analýzu přežití, podporuje číselné i kategorizované prediktory, které mohou být závislé na čase, představuje jednoduchý způsob analýzy rozdílů v podskupinách a také analýzy vlivu určité skupiny prediktorů, dokáže pracovat s daty zahrnující opakovaná pozorování. Modul ověřuje vztahové a kauzální hypotézy a modely Poskytuje metodologii modelování strukturálních rovnic pro vytvoření modelů V programu dochází ke specifikaci, odhadu, ohodnocení a prezentace modelu v jednoduchém a intuitivním strukturním grafu zobrazujícím nejprve hypotetické a ve výsledcích už ověřené vztahy mezi proměnnými
Možnost vytvořit model pomocí jednoduchého programového kódu, ve formě tabulky nebo pomocí jednoduchého programovacího kódu Zvýšení reliability proměnných zahrnutím mnohonásobných indikátorů Imputace vynechaných hodnot a latentních skórů Použití pro longitudinální studie s opakovanými měřeními a analýzu reliability Vytváření modelu chování či postojů respondentů, který realisticky odráží komplexní vztahy Disponuje statistickými nástroji založenými na metodách maximální věrohodnosti, či na různých modifikacích přístupu nejmenších čtverců, postupech bootstrap nebo na bayesovských odhadech Simultánní porovnání modelů z více populací, reliabilita proměnných se zvyšuje zahrnutím mnohonásobných indikátorů Ověřuje vztahové závěry mezi proměnnými, provádí exploraci a buduje modely Modul pro budování přesnějších modelů s odhadem chybějících hodnot Zobrazení struktury vynechaných hodnot pro případy s alespoň jednou vynechanou hodnotou Informace o extrémních hodnotách Hledání významných závislostí mezi získanými a vynechanými daty Sumární statistiky vzorů chybějících hodnot Metoda mnohonásobné imputace pro nahrazení chybějících hodnot specifikace proměnných, jejichž hodnoty budou imputovány a imputační metody monotónní, Fully conditional specification, automatická metoda. Jednorozměrné statistiky, metoda listwise, metoda pairwise Poskytuje analytické procedury podporující mnohonásobné imputace, popisné statistiky, porovnání průměrů, modely, analýzu délky života Sdružování výstupů, diagnostika sdružování, PMML modely pro kombinované odhady parametrů Funkčnosti využitelné v případech, kdy data nesplňují potřebné předpoklady vyžadované běžnými a jednoduššími technikami. Modul obsahuje loglineární a hierarchické loglineární metody pro analýzu vícerozměrných tabulek četností. Zkoumání dat o přežití či trvání určitých jevů pro porozumění sledovaným terminálním jevům v čase a důvodům pro délku trvání nebo délky intervalu do výskytu např. tabulky délky života, Kaplan-Meierova metoda, Coxova regrese Nabídka procedur minimálně: procedury pro zobecněné lineární smíšené modely (široká skupina modelů od jednoduché regrese po mnohaúrovňové modely pro opakovaná měření s nenormálním rozdělením, použití pro ordinální závislé proměnné), obecné lineární modely
(modely zahrnují lineární regresi, ANOVA, ANCOVA, MANOVA a MANCOVA, proceduru lze použít pro opakovaná měření, smíšené modely, post hoc testy pro opakovaná měření, výpočty na základě čtyř typů součtů čtverců, párová srovnání očekávaných marginálních průměrů, sofistikované ošetření prázdných polí a volitelné ukládání matice designu experimentu a souboru efektů), smíšené modely, zobecněné lineární modely (obsáhlá paleta statistických modelů od klasické lineární regrese s normálně rozloženou závislou proměnnou přes logistické modely pro binární data až po liglineární modely pro kategorizovaná data) a obecné odhadové rovnice (rozšíření zobecněných lineárních modelů pro použití v situaci korelovaných longitudinálních či skupinkových dat) Lineární smíšené modely rozšíření obecných lineárních modelů o analýzu dat, která jsou vnitřně korelovaná a vykazují nekonstantní rozptyl. Lze vytvořit modely pro střední hodnoty, rozptyly i kovariance. Příklady modelů: model ANOVA s pevnými efekty, randomizovaný design úplných bloků, model odlišných trendů ve skupinách, model s čistě náhodnými efekty, model s náhodnými koeficienty, víceúrovňová analýza, nepodmíněný model lineárního růstu, model lineárního růstu s kovariátami na úrovni osob, analýza opakovaných měření, analýza opakovaných měření s časově závislými kovariátami. Další podmínky: Zadavatel si vyhrazuje právo změnit, upřesnit a doplnit podmínky veřejné zakázky, dále zadávací řízení do rozhodnutí o výběru zrušit, případně veškeré nabídky odmítnout. Zadavatel si vyhrazuje právo před rozhodnutím o výběru nejvhodnější nabídky ověřit informace obsažené v nabídce u třetích osob, případně požádat o předložení dodatečných informací či dokladů prokazujících splnění kvalifikace nebo objasnění předložených informací či dokladů, které uchazeč předloží v nabídce. Uchazeč je povinen k tomuto poskytnout veškerou potřebnou součinnost. Zadavatel si vyhrazuje právo jednat s vybraným uchazečem o podrobnostech smluvních podmínek. Zadavatel nepřipouští varianty nabídek.