Studie proveditelnosti počítačem adaptovaného testování v prostředí českých škol

Rozměr: px
Začít zobrazení ze stránky:

Download "Studie proveditelnosti počítačem adaptovaného testování v prostředí českých škol"

Transkript

1 Studie proveditelnosti počítačem adaptovaného testování v prostředí českých škol Autorský tým: Mgr. Zuzana Filípková, PhD. Doc. PhDr. Petr Byčkovský, CSc. S využitím podkladů PhDr. Jitky Houfkové, PhD., a Mgr. Jany Burešové Praha, duben 2008

2 Obsah 1 Počátky a vývoj adaptivního testování Počítačový adaptivní test (CAT) pojetí, druhy a banka úloh Proces administrace a skórování CAT (přehled) Stručně o teorii odpovědi na položku (item response theory, IRT) Výhody a nevýhody CAT oproti konvenčním testům Literatura... 24

3 1 Počátky a vývoj adaptivního testování Adaptivní testování prošlo v USA dlouhým vývojem, k rozvoji počítačového adaptivního testování (computer adaptive testing, CAT) přispěla zásadním způsobem teorie odpovědi na položku. U nás zatím bohužel o nějakém vývoji CAT nemůže být vůbec řeč. Adaptivní testování vzniklo pro účely výkonových testů a je v nich také v současnosti nejvíce rozvíjeno, zejména v dichotomně skórovaných testech, i když adaptivní testy se objevují i v psychologii v oblasti diagnostiky (testy osobnosti, Jelínek; Květoň; Denglerová 2006). Adaptivním testováním se zejména v USA zabývá mnoho expertů, např.: Drasgow a Olson-Buchanan (1999), Sands, Waters a McBride (1997), Wainer (2000), Weiss (1983) a stále se v této oblasti vedou výzkumy. U nás se adaptivnímu testování zatím dostatečně nevěnuje žádný odborník. Adaptivní testování je testovací metodologie, která vyžaduje počítač nejen pro své zadávání, i když adaptivní přístupy, dvou- (nejjednodušší a nejstarší) a víceúrovňové (fixní větvené modely - pyramidové, skokové a stratifikované) existovaly již před nástupem počítačů (Jelínek, Květoň, Denglerová, 2006; Weiss 1973). Adaptivní testování se objevilo již na počátku 20. stol. První adaptivní testy První adaptivní test vytvořil Alfred Binet společně se svým spolupracovníkem Theodorem Simonem (Binet & Simon, 1905). Šlo o tzv. Binet IQ test. Test se používá v moderní verzi dodnes. Binetův test se skládal ze setu testových úloh seřazených podle chronologického věku. Administrace tohoto testu byla zcela adaptivní. Binet zařadil úlohy pro určitou věkovou mentální úroveň, pokud cca. 50% dětí daného věku odpovědělo úlohu správně. V původní verzi zahrnoval test 9 věkových úrovní (od 3 do 11 let). Tyto úlohy tvořily Binetovu banku úloh pro adaptivní test. Úlohy byly zadávány po deseti individuálně školeným psychologem, který okamžitě odpovědi vyhodnocoval, a podle nich zadával testovanému úlohy vyšší (když odpověděl většinu z nich správně) či nižší věkové úrovně (když většinu chybně). Testování bylo ukončeno, pokud byly u testovaného identifikovány jak základní ( basal ), tak stropní (horní, ceiling ) věková úroveň. Stropní úroveň definoval Binet jako věkovou úroveň, na které testovaný nezodpoví ani jednu úlohu správně; základní úroveň naopak jako tu, na které odpoví všechny úlohy správně. Konečný skór testovaného v Binetově testu je založen na podskupině úloh, které zodpověděl správně. Paralelně s vojenským testováním probíhal od počátku 20. století vývoj přijímacích testů na amerických univerzitách. K tomuto účelu byla založena organizace College Board. Úspěch vojenského testovacího programu ovlivnil College Board a ta začala s vývojem testu studijních předpokladů Scholastic Aptitude Test (SAT) byl SAT, který se skládal z 9 (1928 z 8 a 1929 ze 7) subtestů, poprvé zadán. V roce 1934 se profesor Benjamin Wood z Kolumbijské univerzity spojil s inženýry z IBM, aby společně vytvořili mechanický přístroj na skórování testů. Vynález prvního takového přístroje se připisuje středoškolskému učiteli B. Johnsonovi. Organizace Educational Testing Service a College Board vyvinuly CAT testovací systém pro IBM počítače pro testování základních dovedností v angličtině a matematice na úrovni střední školy (Abernathy, 1986; Ward aj., 1986). Poté následovaly další adaptivní testovací systémy např. od Assessment Systems Corporation (MicroCAT), Psychological Corporation či The Waterford Testing Center (více Bunderson, Inouye, Olsen, 1989). Počítačové adaptivní testy V 50. letech se začalo s využíváním počítačů při testování. Systémy počítačem řízeného testování (CAI Computer Assisted Instructions) byly ovlivněny behaviorální psychologií. Jednalo se o jednoduché lineární programy. Z lineárních programů byly později v 60. letech vyvinuty programy větvené, které již nabízely určité přizpůsobení studentovi a obsahovaly rozdělující podmínky. Příklad podmínky: Pokud byla otázka 2 zodpovězena správně, polož otázku 10, v opačném

4 případě polož otázku 3. Tyto programy byly v 70. letech nahrazeny výukovými systémy, které byly schopny vytvořit novou sadu otázek z různých úloh banky, ale přizpůsobení studentovi bylo velmi omezené a neodpovídalo potřebám jednotlivců. Programy obsahovaly předem pevně dané větve a smyčky otázek a neposkytovaly možnost úplného přizpůsobení hladině vědomostí testovaných jedinců. Větší výzkum v oblasti testů s využitím výpočetní techniky provedl až F. Lord ve 2. pol. 60. let a na počátku 70. let 20. století. Pracoval jak na teoretické struktuře hromadně zadávaného, ale individuálně ušitého testu pro úroveň schopností testovaného, tak i na mnohých praktických detailech. První pokusy implementovat adaptivní testy byly neobratné a/ nebo drahé. Americká armáda však brzy rozpoznala potencionální výhody adaptivního testování a podpořila finančně rozsáhlý teoretický výzkum. Studie zaměřené na adaptivní testování se systematicky objevují v odborném tisku od 70. let 20. století. Nicméně první reálnou příležitostí vyzkoušet adaptivní testování byla až dostupnost cenově příznivých výkonných počítačů v 80. letech. První vojenský prototyp počítačového adaptivního testu (computer adaptive test, CAT) byl vyvinut pro Apple III počítače ve výzkumném centru Naval Personnel Research and Development Center (NPRDC) v roce Tento prototyp byl určen k první širokoplošné počítačové adaptivní administraci subtestů z testu ASVAB 1. V roce 1973 navrhl Weiss (Weiss 1973) počítačovou variantu Binetova testu, kterou nazval stratifikovaný nebo-li stradaptivní test (The stratified adaptive computerized ability test).. Poté následovaly další stradaptivní testy (Weiss, 1979). Weissův test používal stejnou strukturu banky úloh jako Binetův test, úlohy byly uspořádány po deseti do věkových mentálních úrovní dle obtížnosti (tzv. strata = vrstva). Podobně jako v Binetově testu používá stratifikovaný test proměnlivou startovací úroveň, a tím dovoluje začít na jakékoli úrovni obtížnosti přiměřené každému testovanému. Stratifikovaný test se od Binetova liší v tom, že je zadána vždy pouze jedna úloha a skórována. Další úloha je zadána na základě předchozí odpovědi. Pokud je odpověď správná, je testovanému zadána úloha z následující těžší vrstvy. Když testovaný odpoví chybně, bude mu zadána úloha z nejbližší nižší vrstvy. Tento proces pokračuje tak dlouho, dokud není splněno kritérium k ukončení testu. Test je ukončen, když jsou všechny úlohy nebo pět po sobě následujících úloh v určité vrstvě zodpovězeny chybně. Obr. 0 zobrazuje příklad záznamu odpovědí v stradaptivním testu. V tomto testu byla zvolena za startovací úroveň mentální úroveň 9. První úloha (1) byla zadána a zodpovězena správně (+), a tak další úloha byla zadána z úrovně 9,5. Po správné odpovědi (2+) byla potom zadána úloha z úrovně 10. Protože tato úloha byla zodpovězena chybně (3-), byla následně zadána opět úloha z nejbližší nižší úrovně 9,5, která byla vyřešena správně (4+). Proces pokračoval tímto způsobem až do zadání 31. úlohy. Úloha 30 byla zodpovězena chybně, ale protože z úrovně 9 bylo zadáno již deset úloh, musela být 31. úloha zadána z úrovně nižší, tedy 8, 5. Protože z úrovně 10 byly všechny úlohy zodpovězeny chybně (jako poslední úloha 44), byla mentální úrověň 10 identifikována jako stropní úroveň. Sloupec s hodnotami poměrů správných odpovědí (proportion correct) poukazuje na typické výsledky stratifikovaného testu. Jak očekáváno, tyto poměry se zvyšují (od 0 do 1) se snižující se obtížností úlohy (mentální úrovně). Celkový poměr správných odpovědí je na optimální úrovni roven 0, byl vytvořen pro americkou armádu test Army Alpha (revize původního testu Examination a, který obsahoval 10 subtestů) o 8 subtestech. Tento test měl již známky podobnosti ke kognitivním částem moderního testu Armed Services Vocational Aptitude Battery (ASVAB) používaného v současnosti americkou armádou. Army Alpha a Army Beta (určen pro negramotné a ne anglicky mluvící brance) byly společně prvním širokoplošným testováním IQ (2 milióny mužů byly jím otestovány; Wainer 2000). Testovací vojenské programy se staly rozsáhlejšími za 2. světové války. V roce 1939 následovalo přepracování Army Alpha, tzv. Army General Classification Test (AGCT), který obsahoval 4 části. Posledním předchůdcem nynějšího testu ASVAB byl Armed Forces Qualification Test (AFQT).

5 Obr. 0 Příklad záznamu odpovědí v stratifikovaném testu (Weiss 1973) V roce 1974 publikoval M. D. Reckase informace o interaktivním počítačovém programu pro adaptabilní testování založené na jednoparametrovém logickém modelu (1PL model). Mezi další testy odvozené od Binetova testu patří například Lordova Flexilevel testing procedure (1980), Henningova Step Procedure (1987) a Lewisovy a Sheehanovy Testlety (1990), viz [ ]. Tyto testy pracují se sety úloh rozdělené podle obtížnosti. Testovací software předloží testovanému celý vybraný set úloh a teprve na základě jeho odpovědí na všechny úlohy v setu je určována úroveň obtížnosti následujícího setu otázek. V posledních letech se staly počítačové adaptivní testy široce používané, řada testovacích programů v USA, ale i v Evropě je zařadila do své nabídky. Jde např. o počítačovou adaptivní verzi testu Graduate Management Admission Test (GMAT), testu studijních předpokladů pro uchazeče o doktorské studium Graduate Record Examination (GRE) 2 či o test pro získání licence zdravotní sestry National Council Licensure Examinations (NCLEX) 3 používané v USA. Počítačové adaptivní verze některých dalších amerických testů jsou zatím ve výzkumných fázích, např. testy studijních předpokladů ACT (American College Testing Program), SAT (Scholastic Assessment Test) či test pro udělení lékařské licence USMLE TM (Medical Licencing Examination). Výčet některých aktuálně dostupných počítačových adaptivních testů je uveden v tab V roce 1993 poprvé zveřejnila největší světová testovací organizace ETS počítačovou adaptivní verzi testu GRE. Použití testu GRE v papírové verzi ETS pozvolna redukuje. 3 Nursing Boards zcela přešla již 1994 od papírové verze testu NCLEX k počítačovému adaptivnímu testu.

6 Tab. 1 Přehled některých počítačových adaptivních testů název testu zkratka kdo ho vytvořil popis testu internetový odkaz Test pro potřeby Graduate Graduate Management GMAT ETS (USA) Management Admission Test GMAT Admission Council. Graduate Record Examination National Council Licensure Examinations Armed Services Vocational Aptitude Test Battery Adaptive Matrices Test CAT of Written English for Spanish Speakers Computerized Adaptive Test of English GRE NCLEX ASVAB AMT CATE ETS (USA) NCSBN (National Council of State Boards of Nursing; USA) U.S. Department of Defence (USA) Dr. Schuhfried GmbH (Rakousko) CAT research group at the Autonoma University of Madrid English Language and Learning Support of the Information and Learning Resource Services at Middlesex University (Velká Británie) Test studijních předpokladů používaný v USA při přijímacím řízení na postgraduální studium. Test pro udělení licence pro zdravotní sestry. Multiple-ability test battery. Částí Vienna Test System, mimoverbální hodnocení všeobecné inteligence založené na deduktivním úsudku. Test z angličtiny pro Španěle, je zadáván on-line. Test angličtiny pro uchazeče o studium, kteří nemají angličtinu jako rodný jazyk. s placementtests wts/amt ecatpdf.pdf V současné době je pozornost odborníků věnována i možnostem a úskalím zadávání CAT testů prostřednictvím internetu.

7 2 Počítačový adaptivní test (CAT) pojetí, druhy a banka úloh Co je adaptivní počítačový test? Adaptivní (přizpůsobivé) testování prostřednictvím počítačů (computer-adaptive testing, CAT) je metoda zadávání a zpracování testů, která přizpůsobuje výběr testovacích úloh schopnostem testované osoby. Proto je také někdy nazýváno testováním na míru (tailored testing). Adaptivní počítačový test (computer adaptive test, CAT) je test, při kterém testovací software vybírá úlohy pro testovaného z relativně velké banky úloh podle jeho odpovědi/odpovědí na úlohu/úlohy předešlou/předešlé. Pokud testovaný odpoví správně, dostane úlohu obtížnější, pokud chybně, je mu zadána úloha snadnější. Volbou obtížnosti úloh se testovací software přibližuje úrovni schopnosti zkoušeného. Test většinou končí, když se výkon zkoušeného na dané úrovni schopnosti ukáže být jeho nejvyšším možným výkonem. S CAT je během testovacího procesu postupně odhadována relativní úroveň schopností testovaného vzhledem k referenční skupině (norm group) a testovací úlohy jsou vybírány na základě okamžitého odhadu schopností. Zkoušení tak dostávají úlohy, které maximalizují získání informací o jejich schopnostech. Díky tomu obdrží zkoušení jen velice málo úloh, které jsou pro ně příliš těžké nebo příliš lehké. Tento výběr testovacích úloh podle úrovně zkoušeného vede ke snížení standardní odchylky a k větší přesnosti testu při menším množství testových úloh. Adaptivní testování tedy vyžaduje aparát, který by dovedl smysluplným způsobem popsat úlohy a rozdíly mezi nimi, určit efektivní pravidla pro aktuální výběr úloh k zadání a dospět k výslednému skóru, aniž by byl závislý na konkrétním souboru zadaných úloh (Wainer; Mislevy 2000). Nejvhodnějším matematickým aparátem se ukazuje být teorie odpovědi na položku (IRT), a proto je na ní také založena většina současných adaptivních testů (např. Goldstein, Wood, 1989; Lord, 1980; Van der Linden, Hambleton, 1997; Wainer, 2000; Embretson, Reise 2000; Baker, Kim 2004). Na tvorbu CAT byly vyvinuty speciální software, např. nejnovější je program FastTEST Professional Testing System Version 2.0 (Fast TEST Pro) z roku 2006 od americké Assessment Systems Corporation (www.assess.com). Druhy CAT Adaptivní testy se od sebe liší tím, zda jsou v nich úlohy vybírány a posléze zadávány testovaným individuálně či baleny do bloků/ setů (multilevel či multistage tests, např. Jodoin 2003) nebo dokonce do malých testíků. Ve všech případech jsou vybírány na základě předchozí odpovědi či odpovědí na všechny úlohy v bloku. Nejjednodušším modelem adaptivního testu je test tvořený z tzv. screening testu (neadaptivní povahy), na jehož základě je podle jeho odpovědí testovanému přidělen buď test nižší či vyšší obtížnosti, opět s lineárním uspořádáním úloh. Drasgow; Luecht; Bennett (2006) rozlišují tři modely počítačového adaptivního testování: - CAT na úrovni úloh (item-level computer-adaptive testing); - CAT založený na testletech a počítačové mastery testy (testlet-based CAT and computerized mastery tests); - Strukturované počítačové adaptivní vícestupňové testy (Structured computer-adaptive structured computer-adaptive multistage tests). CAT na úrovni úloh (Item-level computer-adaptive testing) V tomto modelu se přizpůsobuje obtížnost testu každému testovanému na míru, a to úloha po úloze. Výběr úloh vychází z výkonu testovaného v úloze předchozí. CAT se tedy postupně vyvíjí v reálném čase pomocí software. Primárním kritériem je zde maximalizovat informační funkci testu, a tím minimalizovat chybu měření výsledku testovaného v testu. Obr. 1 zobrazuje, co se děje během CAT se skóry schopností testovaných (od -3 do +3; Ability Estimate, svislá osa) a asociovanými standardními chybami pro dva hypotetické testované (Examinee A, Examinee B) v testu o 50 adaptivně zadávaných úlohách (Item Sequence, vodorovná osa). Z obr. 1 je vidět, že

8 oba testovaní dostali na začátku úlohu průměrné obtížnosti (schopnost rovna nule, uprostřed svislé osy). Po zadání první úlohy se odhady schopností těchto testovaných začínají odlišovat, až dosáhnou přibližných skutečných hodnot schopností (-1 u testovaného B, +1 u testovaného A). Z obr. 1 je patrné, že testovanému A byly zadávány těžší úlohy než testovanému B. Také zde vidíme, jak rychle při testování klesá rozptyl chyby odhadů schopnosti a jak se zlepšuje efektivita testu. Obr. 1 Úrovně schopností a standardní chyby pro CAT o 50 úlohách pro dva hypotetické testované Obr. 2 ukazuje efektivitu CAT oproti testu s náhodně vybranými úlohami. Graf zobrazuje průměrné standardní chyby odhadů schopnosti testovaných v průběhu zadávání 50 úloh (vodorovná osa). Chyby odhadů jsou průměrovány u testovaných mající rozdílné skóry schopností. Z obr. 2 je patrné, jak chyby měření v obou případech postupně klesají, i když u adaptivního testu více. Např. CAT po zadání 20 úloh dosahuje téměř stejnou efektivitu jako test s 50 náhodně vybranými úlohami (viz obr. 2). Obr. 2 Průměrné standardní chyby pro CAT o 50-ti úlohách ve srovnání s testem s náhodně vybranými úlohami

9 CAT založený na testletech a počítačové mastery testy (Testlet-Based CAT and Computerized Mastery Tests) CAT založený na testletech (testletem rozumíme sadu úloh či mini-test ) zahrnuje adaptivní administraci předem sestavených sad úloh testovaným. Jednotkou testu zde tedy není jednotlivá úloha, ale testlet. Po zadání testletu jsou všechny úlohy v něm okamžitě skórovány a na jejich základě je potom vybírán další testlet. Test je ukončen po zadání posledního testletu či po dasažení jiného ukončovacího kritéria. U takovýchto testů je banka úloh uspořádána do testletů, ve kterých se úlohy vyskytují právě jednou a neopakují se. Je tedy zřejmé, že tyto testy jsou jen částečně adaptivní, protože úlohy v rámci testletu jsou zadávány lineárně a nikoli adaptivním způsobem. CAT založený na testletech je podobný k počítačovému mastery testu (PMT). V originálním PMT jsou testlety vybírány náhodně z banky paralelních testletů. Test pokračuje obvykle nad rámec nějakého minimálního počtu testletů dokud není dosaženo předem stanovené minimální hodnoty standardní chyby ve vztahu k tomu, zda testovaný napsal test úspěšně či neúspěšně. Strukturované počítačové adaptivní vícestupňové testy (Structured computer-adaptive multistage tests = ca-mst) Strukturované počítačové adaptivní vícestupňové testy jsou adaptivní testy s vlastní administrací používající opět testlety. Základní jednotkou je zde tzv. modul či testlet. Tyto moduly jsou předem sestaveny ze sady úloh o různém počtu od několika úloh až po např. 100 úloh. Z perspektivy testovaného se jeví ca-mst funkčně jako vícestupňové lineární testy. Obr. 3 zobrazuje třífázový ca-mst jako sérii tří modulů/ testletů. Po každé fázi probíhá skórování a následné nasměrování do další fáze, které je z velké části pro testované skryté. Z psychometrického hlediska splňuje každá série tří testletů statistické i obsahové požadavky. Testlety jsou baleny do tzv. panelů. Každý panel obsahuje čtyři až sedm (i více) testletů. Testlety jsou explicitně určeny pro konkrétní fázi a specifickou cestu uvnitř panelu (lehčí, průměrnou, těžší) založenou na průměrné obtížnosti testletu. Násobné (Multiple) panely mohou obsahovat i stejné úlohy. Obr. 3 představuje jeden z možných návrhů vícestupňového panelu typu (1-3-3 multistage panel design). Jeden testlet je přidělen fázi 1 (A, stage 1), tři fázi 2 (B, C, D) a tři další testlety fázi 3 (E, F, G). Obtížnost každého testletu se určuje pomocí IRT informačních funkcí. Existuje tedy sedm explicitních cílových informačních funkcí testu tvořících základ pro panel typu (viz obr. 3). Jde o tyto cesty: A+B+E, A+B+F, A+C+E, A+C+F, A+C+G, A+D+F a A+D+G. Mícháním testletů uvnitř panelů mohou být vytvořeny stovky nových panelů, pokud je banka úloh dostatečně rozsáhlá. Skórování odpovědí testovaných a výběr dalších úloh v reálném čase lze zjednodušit pomocí předem vytvořené tabulky odpovědí score routing table pro každý panel. Mechanismus skórování a výběru úloh využívá kumulativní četnost správných odpovědí a předem stanovených hraničních skórů k napodobení kritéria maximální informace používaného v CAT. Taková tabulka je skrytou součástí panelu, příklad našeho panelu vyžaduje deset hodnot skórů: A B, A C, A D, A+B E, A+B F, A+C E, A+C F, A+C G, A+D F a A+D G.

10 Obr. 4 Příklad uspořádání počítačového adaptivního vícestupňového testového panelu Počítačové adaptivní testy se používají k různým účelům: A) Buď chceme na jejich základě umístit každého testovaného podle jeho výkonu podél osy schopnosti nebo B) jen roztřídit testované do dvou či více širších kategorií (adaptive mastery testing, Kingsbury; Zara 1989 či computerized mastery testing, Sheehan; Lewis 1992). Dále se zaměřujeme kvůli zaměření této studie na adaptivní testy typu A) s individuálně zadávanými úlohami. Banka úloh Úlohy pro adaptivní test jsou shromažďovány v dostatečně velkém počtu v tzv. bance (někdy také databázi) úloh (item bank), která obsahuje min. 100 různorodých, dostatečně citlivých úloh (jak dobře úloha rozlišuje mezi studenty s různými schopnostmi) různých obtížností, vytvořená pro dané úrovně schopnosti θ (theta) testovaných a danou tématickou oblast. Obtížnost a citlivost úloh jsou získávány jako výsledek aplikace teorie testů. Existují různé modely, které je možno použít pro určení vlastností úlohy. Všechny modely předpokládají vztah mezi neměřitelnou schopností θ, měření. V případě CAT se zdá být nejvhodnější (viz výše) teorie odpovědi na položku (item response theory, IRT). Banka úloh by měla při použití IRT modelů obsahovat minimálně o 100% až 200% více testových úloh, než je úloh do testu navrhovaných. Davey; Pitoniak uvádějí, že by v bance mělo být 5 až 10 paralelních testových forem, i když ve skutečnosti je to trochu komplikovanější (Davey; Pitoniak 2006). Úlohy v CAT bance jsou většinou kvůli okamžitému (v reálném čase) automatickému (elektronickému) skórování úlohy uzavřené s výběrem odpovědi 4 nebo úlohy otevřené se stručnou odpovědí. Na úlohy v CAT jsou samozřejmě kladeny stejně velké nároky jako na profesionální neadaptivní úlohy. V posledních letech však technologie pokročila kupředu a již dnes lze automaticky skórovat i krátké (open-ended items, Burstein 2003, Burstein; Chodorow, Leacock 2004). a dokonce i komplexní, široké otevřené úlohy z medicíny (Clauser; Schuwirth 2002). Formát úloh může být vzhledem k schopnostem počítače složitý (např. s komplexní grafikou či video nahrávkou). Banku je třeba navrhovat velmi pečlivě s ohledem na to, že testovaným je zadáváno při zachování stejné přesnosti méně úloh než v neadaptivním testu. Jednotlivé úlohy banky je proto zapotřebí kalibrovat, tj. odhadnout pro každou úlohu jednotlivé statistické parametry (obtížnost, citlivost) v závislosti na používaném IRT modelu. Toto odhadování musí probíhat na dostatečně velkém souboru osob, i když charakteristiky úloh nejsou na tomto souboru závislé a měření 4 Zahrnují vedle tradičních úloh s výběrem odpovědi (multiple choice) úlohy dichotomické (alternativní či true- false), přiřazovací či pořádací.

11 schopnosti testovaného lze interpretovat i mimo populaci, pro kterou byl test standardizován (Hambleton 1991). Proces kalibrace je zdlouhavý, drahý a vyžaduje sběr empirických dat od velkého počtu testovaných. Obvykle je základem studie skupina i více testovaných. Snaha vyhnout se potřebě obrovských empirických výzkumů vede k používání systémů umělé inteligence a strojového učení (machine learning), kdy se empirická data nahrazují výsledkem namodelovaných postupů řešení úloh. Byl například vypracován CBAT-2 algoritmus, který vytváří vyrovnaný test zaměřený na přesně vymezenou část obsahu školního kurikula. Uvažování v rámci IRT je většinou unidimenzionální, proto bývá potřeba při budování banky úloh řešit problém multidimenzionality, např. vyvážením obsahu (content balancing, více např. Kingsbury; Zara 1991, Leung; Chang; Hau 2003) či rozdělením obsahu podle témat do jednotlivých subtestů (multiple scales, více např. Gialluca; Weiss 1979). Nastavení vyváženého obsahu se provádí z toho důvodu, aby žádná část testované oblasti nebyla testována výrazně více než jiná. Také je třeba dbát na to, aby některé úlohy neřešilo mnohem více testovaných (studentů) než úlohy jiné. Může to být dáno drobnými odlišnostmi v obtížnosti a rozlišovací schopnosti úloh, které vedou k jejich častějšímu výběru. Úloha, která by se objevovala ve většině testů, by se mohla stát veřejně známou a ovlivnit tak průběh testu. Přílišné nadužívání úloh je tedy nežádoucí. Stejně tak položka, která by se v testech příliš nevyskytovala, by byla zbytečně připravována. Proto některé testovací algoritmy sledují četnost použití jednotlivých úloh a při překročení stanoveného limitu, jsou takové úlohy dočasně vyřazeny z dalšího testování. Tak se v testu postupně objeví všechny úlohy. Otázkou však zůstává, zda odstranění některých úloh (zvláště těch, které se ukázaly jako vhodné) nezmění výsledky testů. Při ověřování vlivu použití kontroly četnosti na testy se ukázalo, že tímto způsobem může dojít k určitému snížení přesnosti měření a také k určitému prodloužení testů (T.J.H.M. Eggen, 2004, ). Pokud není velké riziko prozrazení úloh, nemusí se omezení počtu použití aplikovat. 3 Proces administrace a skórování CAT (přehled) Proces administrace počítačového adaptivního testu se skládá ze dvou základních kroků: z výběru úlohy a z odhadu úrovně schopnosti testovaného. Oba kroky se vždy po zodpovězení úlohy testovaným opakují. Při zadávání adaptivního testu vybírá počítač na základě předem zjištěných parametrů (určených IRT kalibrací úloh v bance) takové úlohy, které o daném testovaném s určitou odhadovanou úrovní schopnosti θ podávají maximální množství informace. Nejcitlivější úloha rozlišuje mezi jedinci, u kterých se úroveň θ vyskytuje v blízkosti hodnoty obtížnosti dané úlohy. Počítačový adaptivní test založený na IRT pracuje následovně (viz obr. 5). Cílem testu je zjistit, co testovaný ví o daném tématu. Jinými slovy chceme co možná nejpřesněji odhadnout úroveň jeho schopnosti θ. výběr úlohy z banky zadání úlohy použití odpovědi k zpřesnění odhadu schopnosti testovaného Banka úloh výběr další úlohy z banky NE Test ukončen? ANO výpočet konečného odhadu schopnosti testovaného Obr. 5 Proces administrace CAT (upraveno podle Davey; Pitoniak 2006) Nejprve počítač vytvoří počáteční odhad schopnosti θ testovaného, který buď může být pro všechny testované shodný (průměr schopností předešlých testovaných) nebo může být stanoven pro každého testovaného zvlášť na základě nějaké dostupné informace o něm (např. výkon v předchozích testech, známka, informace od učitele). Odpověď testovaného je poté okamžitě skórována a podle množství informace, kterou úloha podává na aktuální úrovni jeho schopnosti θ

12 počítač vybírá (s určitou tolerancí) z banky úloh úlohu s maximálním množstvím informace. 5 Ta je obvykle vybírána podle tzv. pravidla kroku (step-rule). Odpoví-li testovaný na první úlohu správně, je původní odhad jeho schopnosti θ zvýšen o určité číslo (často o 0,5 či 1), když chybně, je odhad snížen o stejné číslo. Tento postup se opakuje do té doby, dokud testovaný nezíská vzorek odpovědí (response pattern) skládající se minimálně z jedné chybné a jedné správné odpovědi. Poté se pro výpočet nového odhadu θ, který je založen na všech předchozích odpovědích, použije metoda maximální věrohodnosti 6 (maximum likelihood estimation). Po zadání a skórování každé další úlohy je odhad θ testovaného opět upraven a na jeho základě vybrána další ještě nezadaná úloha, která poskytuje největší informaci. Odhad schopnosti testovaného je s každým krokem zpřesňován. Proces počítačového adaptivního testování (zpravidla konvergentního) znázorňuje obr. 6. schopnost θ testovaného Obr. 6 Proces výběru úloh (upraveno podle Alessi; Trollip 2001) Obr. 7-9 objasňují výběr úloh podle maximální informace v CAT. Na obr. 7 vidíme kromě informačních křivek 10ti úloh počáteční odhad schopnosti θ = 0 pro hypotetického testovaného (viz svislá čára). Vodorovná osa je osa schopnosti θ testovaného, svislá osa určuje množství informace. Hodnoty informace jsou vypočteny pro všechny úlohy na této úrovni θ. Z obr. 7 je zřejmé, že úloha 6 podává největší množství informace ze všech 10 úloh pro úroveň schopnosti θ = 0 (viz svislá čára). Proto je tato úloha počítačem vybrána, zadána testovanému a poté okamžitě skórována. Obr. 7 Informační funkce 10 úloh Na základě tohoto skóru (zde: chybně) je určen nový odhad θ = -1 (zde: použit krok o velikosti 1). Podle množství informace je dále vybrána úloha 4 (obr.8), protože poskytuje pro θ = -1 nejvíce informace, a skórována. 5 6 Množství informace se stanovuje pomocí informační funkce z IRT. Metodou maximální věrohodnosti se odhaduje schopnost jedince jako maximální hodnota určité pravděpodobnostní funkce (Hambleton 1991). Jiná běžně používaná metoda pro odhad θ testovaného je Bayesova metoda odhadu.

13 Obr. 8 Informační funkce 9 úloh Za předpokladu, že úlohu 4 testovaný zodpoví správně, čímž získáme vzorek jedné chybné a jedné správné dopovědi, můžeme použít metodu maximální věrohodnosti k dalšímu odhadu θ. Výsledkem je θ = -0,5. Dále tedy byla vybrána úloha 5 (obr. 9). Obr. 9 Informační funkce 8 úloh Tento proces pokračuje tak dlouho, dokud není splněno kritérium pro ukončení testu. Kritéria pro ukončení testu U adaptivních testů fixní délky je test ukončen po vyčerpání všech úloh. Všem testovaným je tedy zadán stejný počet úloh bez ohledu na chybu měření asociovanou s jejich skórem. U CAT variabilní délky končí test, když je dosaženo předem stanovené přesnosti měření. Jednou z důležitých charakteristik CAT je to, že kritérium ukončení CAT se může lišit podle cílů testování (zda jde o testy rozlišující či ověřující). S každým odhadem θ je spojena standardní chyba odhadu (standard error of estimate, SEM), protože pokaždé, kdy počítačový program počítá odhad schopnosti θ, je málo pravděpodobné, aby byl tento odhad naprosto přesný. Avšak je možné udat interval, v kterém se odhad bude pohybovat. Tento interval se zmenšuje, je-li zadáno více úloh, což je zřejmé, protože odhad se zpřesní, když se nashromáždí více informací. Program ukončí zadávání úloh v okamžiku, když chyba odhadu je přijatelně malá, tedy když je jisté, že daný odhad je dostatečně blízko k reálné úrovni schopnosti testovaného.

14 4 Stručně o teorii odpovědi na položku (item response theory, IRT) Problematika teorie odpovědi na položku (IRT) je velmi rozsáhlá a zásadně přesahuje rámec této studie, proto dále uvádíme pouze přehled jejích základních myšlenek. Otázka odhadu položkových parametrů a odhadu úrovně schopnosti testovaných je pro svůj poměrně složitý matematický aparát pouze nastíněna, je nutné ji řešit za pomocí software (viz např. Embretson; Reise 2000, Hambleton; Swaminathan; Rogers 1991). I když u nás ještě teorie odpovědi na položku (item response theory, IRT) není zatím příliš známa 7, její pojetí a metodologie byly vyvinuty před více než tři čtvrtě stoletím. Na prakticky aplikovatelné úrovni byla zpracována v posledních 20 letech a ve světě se běžně používá při vývoji nástrojů pro širokoplošné testování. Testy (tedy i jednotlivé úlohy) vyvinuté na základě teorie odpovědi na položku 8 (item response theory, IRT) překonávají nedostatky testů vytvořených pomocí klasické teorie testu (KTT). Nejdůležitějšími z nich je závislost charakteristik úloh (tím se míní zejména obtížnost a citlivost úloh) na souboru testovaných, kterým byly položky zadány, a skutečnost, že KTT nahlíží na položky výhradně v kontextu konkrétního testu, tj. položky nejsou od celku testu oddělitelné (položky jsou korelovány s celkovým skórem). Nelze předpokládat, jak testovaný v úloze odpoví. Oproti tomu IRT uvažuje o položkách a jejich vlastnostech samostatně, nezávisle na souboru testovaných. IRT modely popisují očekávaný vztah charakteristik úloh (položkových parametrů) a úrovně měřeného latentního rysu/ schopnosti (charakterizuje testované, řídí jejich odpovědi, avšak je na charakteristikách položek nezávislá) pomocí pravděpodobnosti správné odpovědi. Tento vztah lze matematicky popsat tzv. charakteristickou křivkou nebo-li funkcí položky (viz dále). IRT předpoklady Pro dichotomická a polytomická data bylo vyvinuto množství různých IRT modelů. My se zaměříme na IRT pro binárně (dichotomicky) skórované úlohy, která je založena na dvou základních předpokladech (Hambleton; Swaminathan; Rogers 1991): 1) odpověď testovaného na příslušnou testovou položku lze předpovědět či vysvětlit souborem latentních rysů nebo-li schopností testovaného (označených řeckým písmenem theta θ ). Latentní rysy nejsou přímo měřitelné, ale předpokládá se, že se projevují v chování testovaného a ovlivňují jeho odpovědi. Jsou na testu nezávislé. 2) vztah mezi odpovědí testovaného v testové položce a jeho schopnostmi může být matematicky popsán funkcí pravděpodobnosti správné odpovědi na položku P(θ), tzv. charakteristickou křivkou/ funkcí položky (item charakteristic curve/ function, ICC). Tato křivka esovitého tvaru zachycuje, jak při rostoucí úrovni schopnosti θ roste pravděpodobnost správné odpovědi. Tvar a polohu křivky (viz obr.10) určují podle zvoleného modelu jeden až tři parametry obtížnost (b), diskriminační schopnost (citlivost) úlohy (a) a pseudonáhodný parametr hádání (c). 7 O IRT informovali zatím jen Komenda (2003), Denglerová (2003, 2005), Urbánek; Šimeček (2001), Jelínek; Květoň; Denglerová (2006). 8 Položka je jinými slovy úloha.

15 parametru a parametru b P( ) parametru c Obr. 10 Ukázka charakteristické křivky položky (upraveno podle Chong 2006) IRT modely Vztah mezi úrovní latentního rysu/ schopnosti a pravděpodobností správné odpovědi P( ) na dichotomicky skórovanou položku lze popsat více či méně přesně třemi různými unidimenzionálními modely 9 nebo-li logistickými funkcemi (Hambleton; Swaminathan; Rogers 1991). Modely zahrnující různé parametry, kde parametr b je obtížnost, a rozlišovací schopnost and c pseudonáhodný faktor. 1-parametrový logistický model nebo-li Raschův model Nejjednodušším a současně nejrozšířenějším IRT modelem, nazývaným podle dánského matematika Raschův model, je 1-parametrový model, který obsahuje pouze parametr obtížnosti. Tento model je tedy vhodný pro testy složené z přibližně stejně citlivých úloh. D( bi ) e Má tvar Pi ( ), i = 1, 2,.., n, kde D( bi ) 1 e P i ( ) je pravděpodobnost, že náhodně vybraný testovaný se schopností vyřeší úlohu i správně; nabývá hodnot od 0 do 1 D je konstanta rovna 1,7, pomocí které se distribuční funkce normálního rozdělení (ogiva) převádí na výhodnější logistickou funkci (protože obě funkce mají velmi podobný průběh) b je parametr obtížnosti úlohy (viz výše) je úroveň schopnosti (latentního rysu) testovaného Obr. 11 zobrazuje charakteristické křivky dvou úloh, které se liší jen s ohledem na obtížnost. Úloha 2 je snazší než úloha 1, protože bod X 1 leží vzhledem k ose blíže k nule než X 2. ICC úlohy 1 leží více vpravo. 9 Vedle unidimenzionálních modelů (jsou nejjednodušší, pracují pouze s jedním latentním rysem) existují pro binární data také multidimenzionální modely, v kterých dvě nebo více úrovní latentního rysu ovlivňují výkon testovaného (více viz např. Embretson; Reise 2000). Řada modelů vznikla také pro polytomické formáty odpovědí na položky či pro škály.

16 P i (θ) úloha 2 úloha ŽCC Obr. 11 ICC úloh 1 a 2 s rozdílnou obtížností Vodorovnou osu tvoří úroveň schopnosti testovaného, svislou pravděpodobnost správné odpovědi na úlohu (upraveno podle Urbina 2004). 2-parametrový logistický model nebo-li Lordův model 2-parametrový model poprvé zavedl v 50. letech 20. stol. Lord, v 60. letech 20. století se jím zabýval Birnbaum. Tento model, zřejmě zobecněním 1-parametrového modelu, uvažuje vedle obtížnosti položky (b) také její citlivost (a). Používá se u otevřených úloh. Dai ( bi ) e Má tvar Pi ( ), i = 1, 2,.., n, kde Dai ( bi ) 1 e a je parametr vystihující diskriminační schopnost položky 10. Na obr. 12 jsou charakteristické křivky dvou úloh, které se liší v obtížnosti a citlivosti. Úroveň schopnosti asociovaná s 50% pravděpodobností správné odpovědi je trochu vyšší u úlohy 1 (x 1 ) než u úlohy 2 (x 2 ). Kromě toho stoupání (strmost) těchto dvou křivek, které ukazuje poměr změny ve schopnostech a změny v pravděpodobnosti správné odpovědi, se liší. Úloha 2 jakožto strmější v prostředním úseku je citlivější než úloha 1. Křivky, které se protínají jako v tomto případě, jsou nežádoucí. P i (θ) úloha 2 úloha 1 Obr. 12 ICC úloh 1 a 2 s rozdílnou obtížností a citlivostí. Vodorovnou osu tvoří úroveň schopnosti testovaného, svislou pravděpodobnost správné odpovědi na úlohu (upraveno podle Urbina 2004). 3-parametrový logistický model θ 10 Ostatní proměnné a konstanta D jsou shodné s 1-parametrovým modelem.

17 3-parametrový model, který je vhodný pro úlohy s výběrem odpovědi, navrhl Birnbaum. Tento model je dán tvarem Dai ( bi ) e Pi ( ) ci (1 ci ), i = 1, 2,.., n, kde Dai ( bi ) 1 e c je parametr hádání a nabývá hodnot od 0 do 1, ale ze své povahy by neměl být vyšší než 1/k, kde k je počet nabídek pro položku Kromě parametrů a a b zahrnuje 3-parametrový model také parametr hádání c, jehož hodnota vyjadřuje pravděpodobnost dosažení správné odpovědi při tzv. slepém hádání nezávisle na schopnosti (u úlohy se 4 nabízenými odpověďmi je pravděpodobnost uhádnutí 0,25). U tohoto modelu již díky parametru c není dolní asymptotou charakteristické křivky úlohy hodnota 0 jako u 1- a 2-parametrického, ale c. Tím je parametr obtížnosti položky určen bodem na škále schopnosti, v němž P( ) = (1 + c)/2. Parametr a je stále úměrný strmosti ICC v bodě b = 0, přičemž zde je tato strmost rovna a(1 - c)/4. Obr. 13 zobrazuje ICC křivky dvou úloh, které se liší třemi parametry: a, b a c. ICC úlohy 1 je strmější než ICC úlohy 2, tj. úloha 2 zřejmě nerozlišuje mezi jedinci různých úrovní tak dobře jako úloha 1. Dle ICC úlohy 2 lze usoudit, že i testovaní nízkých úrovní jsou schopni správně uhádnout odpověď na úlohu 2, parametr c je u této úlohy vyšší než u úlohy 1 (blíže k 0 na svislé ose). Navíc 50% pravděpodobnost úspěchu je asociovaná s vyšší úrovní schopnosti (X 2 ) u úlohy 2. Úloha 2 je tedy obtížnější než úloha 1. Úloha 2 je proto zřejmě z hlediska měřitelných charakteristik méně vhodná než úloha 1. P i (θ) úloha 1 úloha 2 Obr. 13 ICC úloh 1 a 2 s rozdílnou obtížností, citlivostí a různým parametrem hádání. Vodorovnou osu tvoří úroveň schopnosti testovaného, svislou pravděpodobnost správné odpovědi na úlohu (upraveno podle Urbina 2004). θ Informační funkce testu Co se týče přesnosti měření testu, hlavním rozdílem mezi IRT skóry a tradičními testovými skóry 11 je to, že IRT skóry mají rozdílnou přesnost (chybu měření) pro různé úrovně schopnosti (proficiency) testovaných. Reliabilitě testových skórů v KTT odpovídá v IRT množství informace, které test podává svými úlohami. Množství informace o jednotlivých položkách lze matematicky určit tzv. informačními funkcemi (IIF, item information function) zvonovitého tvaru. Informační funkce testu I ( ) pro danou je definována jako součet informačních funkcí I ( ) jednotlivých položek pro tuto, protože úlohy jsou na sobě nezávislé (Hambleton; Swaminathan; Rogers 1991): n Pi ( ) ) I i ( ), kde i ( ) I( i 1 2 I, i = 1, 2,.., n, P ( ) Q ( ) i i i 11 V KTT je standardní chyba měření konstantní pro všechny dosažené skóry a je specifická pro danou populaci.

18 kde P ( ) je charakteristická funkce položky i, Q ( ) 1 P ( ) a P ( ) je první derivace P ( ). i Ze vzorce plyne, že hodnota informační funkce testu závisí na počtu úloh v testu a průměrné hodnotě parametrů citlivosti testových úloh dle zvoleného IRT modelu. Jelikož s počtem položek roste množství informace, měří test jako celek danou schopnost mnohem přesněji než jedna položka. Tvar této funkce závisí na rozložení hodnot parametrů obtížnosti úloh po ose schopnosti a na rozložení a průměrné hodnotě parametrů citlivosti testových úloh. Úloha měří schopnost s největší přesností, tj. nejlépe rozlišuje mezi testovanými s úrovní schopnosti odpovídající hodnotě parametru b obtížnosti úlohy. To znamená, maximální hodnoty dosahuje informační funkce v blízkosti hodnoty parametru obtížnosti dané položky (viz obr. 4-5). Množství informace poskytované úlohou klesá se vzdalováním úrovně schopnosti od obtížnosti úlohy a přibližováním k nule na obou koncích osy schopnosti. Je-li množství informace malé (viz obr. 4-5, úloha 6), nedá se schopnost přesně odhadnout a odhady budou široce rozprostřeny kolem skutečné schopnosti. Takové úlohy jsou statisticky téměř nepoužitelné do testu. Je-li množství informace velké, může být hodnota schopnosti testovaného odhadována přesně, tzn. všechny odhady budou rozumně blízko ke skutečné hodnotě dané úrovně schopnosti. Parametr citlivosti úlohy značně ovlivňuje maximální množství informace pro odhad schopnosti, která je dána úlohou (viz obr 4-5, informační křivky úloh 1 a 2. Hodnoty a < 1 vedou k nízké hodnotě množství informace testu, hodnoty a > 1,7 vedou k vysoké hodnotě množství informace testu. Protože množství informace testu snižují hodnoty c > 0 pro nízké úrovně schopnosti a velké hodnoty c obecně pro všechny úrovně schopnosti (u 3-parametrového modelu), je tendence přizpůsobovat data spíše 1- či 2-parametrovému modelu (kde c = 0, např. Hambleton aj. 1991, Baker 2001). i i i i theta Obr. 14 Ukázka informačních křivek šesti úloh, které se liší množstvím informace, které podávají pro danou úroveň schopnosti (upraveno podle Hambleton aj. 1991) Na obr. 14 jsou informační křivky šesti úloh, které se liší množstvím informace, které podávají pro danou úroveň schopnosti testovaných. Úloha 1 podává nejvíce informace pro = 1, (maximální hodnota informační funkce), pro = -1 a = 3 již žádnou. V úloze 2 se maximum informace soustřeďuje také kolem = 1, na obou svých koncích potom podává stejně málo informace. Úloha 3 podává sice nejvíce informace opět pro = 1, ale mnohem méně než úlohy 1 a 2. Úloha 4 podává nejvíce informace pro = -1,5, atd. Na základě maximálních hodnot informace lze usuzovat, že úlohy 1, 2, 3 jsou těžší než úlohy 4 a 5. Nejméně citlivá je úloha 6, protože podává velmi málo informace pro všechny schopnostní úrovně. Množství informace, které test podává pro hodnotu, je v inverzním vztahu k přesnosti (vyjádřena standardní chybou měření), s kterou je schopnost odhadována:

19 In formation Standard Error 1 SE ( ˆ ), I( ) kde SE ( ˆ ) je standardní chyba odhadu úrovně testovaných testem s informačním přínosem I ( ) (Urbánek; Šimeček 2001). Ta je koncepčně ekvivalentní k standardní chybě měření v KTT, ale na rozdíl od chyby měření v KTT umožňuje zobecnění na různé populace. Čím více informace test na dané úrovni schopnosti poskytuje, tím menší je chyba, s níž je úroveň schopnosti odhadována (viz obr. 15). TEST0001 FORM: Scale Score 0 Obr. 15 Ukázka informační funkce testu a standardní chyby měření v testu OSP, varianta A, PedF UK 2006 (výstup z programu BILOG-MG). Kalibrace aneb stanovení položkových parametrů Stanovení položkových parametrů (tj. kalibraci) a (citlivosti), b (obtížnosti), c ( hádání ) předchází zpravidla klasická položková analýza, pomocí které vyřadíme úlohy s velmi malou citlivostí (hodnota ukazatele citlivosti blízko nuly nebo záporná), abychom zaručili konvergenci při kalibraci parametrů. K výběru dobrých položek se využívá jejich informačních funkcí (informace úloh se liší pro různé úrovně schopnosti testovaných), pomocí kterých můžeme vybrat s velkou přesností úlohy odpovídající námi zvolené úrovni schopnosti. Úlohy s vyššími hodnotami parametru a poskytují více informace o skórování testovaných a tím větší přesnost. Chceme-li například vytvořit test s takovým hraničním skórem, který vytřídí 50% testovaných, vybereme úlohy s vysokými hodnotami a a s hodnotami b blízko nuly (průměrná schopnost ). Podle informačních funkcí položek vybereme tedy takové, které podávají maximální informaci pro hodnoty = 0. Nakonec zkontrolujeme náš výběr pomocí informační funkce testu, která je výsledným součtem informačních funkcí jednotlivých položek, a křivky standardní chyby. Standardní chyba by měla být pro oblast okolo = 0 co nejmenší. Parametry položek Obtížnost položky

20 Obtížnost položky je vyjádřena parametrem b (difficulty parametr nebo threshold), který teoreticky může nabývat hodnot od - do +, ale v praxi se jeho hodnota pohybuje mezi -3 a 3 (Baker 2001). Čím větší je b, tím obtížnější je úloha. Graficky je obtížnost úlohy dána polohou charakteristické křivky (ICC) vzhledem k ose schopností θ. Jde o bod na ose schopnosti, pro který je pravděpodobnost správné odpovědi rovna 0,5, resp. (1+c)/2 u 3-parametrového modelu. Čím je ICC položena více doprava vzhledem k vodorovné ose θ, tím těžší je úloha. Sečteme-li charakteristické funkce položek v celém testu, můžeme výslednou charakteristickou funkci testu použít k předpovídání skórů testovaných s danou úrovní schopností θ. Je-li test složen z relativně obtížných úloh, je charakteristická funkce testu posunuta doprava a testovaní mají tendenci k nižším očekávaným skórům než je tomu u relativně snadných položek. Citlivost (diskriminační schopnost) položky Diskriminační schopnost položky je dána parametrem a (discrimination parameter), který teoreticky může nabývat hodnot od - do + (Baker 2001), ale v praxi se jeho hodnota pohybuje obvykle mezi 0 a 2,8 (Baker 2001). Čím větší je hodnota a, tím lépe úloha rozlišuje mezi testovanými nalevo a napravo od své polohy. Graficky se citlivost úlohy projevuje strmostí ICC v jejím prostředním úseku. Čím větší sklon má křivka (čím je strmější), tím má úloha lepší rozlišovací schopnost, tím je citlivější. Strmost křivky, a tím také parametr a dosahuje své maximální hodnoty v bodě, ve kterém se úroveň schopnosti θ rovná obtížnosti položky. To znamená, b označuje bod na ose schopnosti θ, v kterém úloha nejlépe rozlišuje mezi testovanými. Negativní parametr a citlivosti značí něco chybného v úloze. Buď se jedná o úlohu s technickými nedostatky nebo jde o dezinformaci zpravidla mezi studenty s vysokou úrovní schopnosti. Baker (2001) uvádí doporučené hodnoty parametru a (viz tab. 2). Tab. 2 Doporučené hodnoty parametru citlivosti a pro logistické modely položek. a (logistický) a (normální) citlivost úlohy 0 0 žádná 0,01-0,34 0,006-0,2 velmi nízká 0,35-0,64 0,206-0,376 Nízká 0,65-1,34 0,382-0,788 Přiměřená 1,35-1,69 0,794-0,994 Vysoká 1,7 1 velmi vysoká + + perfektní Pro převod z logistického modelu na model podobný normální ogivě je potřeba hodnoty vydělit číslem 1,7 (normal ogive model value, scaling factor). Uhádnutelnost položky Uhádnutelnost položky je dána tzv. pseudonáhodným parametrem c (guessing parameter, pseudochance-level parameter), který udává, jak velká je pravděpodobnost uhádnutí správné odpovědi na všech úrovních osy schopnosti. Jeho hodnota se teoreticky pohybuje mezi 0 a 1, v praxi většinou mezi 0 a 0,35 (Baker 2001). Čím je tento parametr vyšší, tím výše na svislé ose P(θ) je dolní asymptota charakteristické křivky položky. Když b < 0 a a < 1, pak c není zřejmé (Baker 2001). 2 Pokud data odpovídají zvolenému modelu, což se většinou zjišťuje statisticky testem či grafickou metodou pomocí specializovaného software 12, můžeme sebraná data o testových a položkových skórech využít k odhadování parametrů testových položek, které rozmístí testované a 12 Četné statistické metody k ověření vhodnosti modelu uvádějí např. Hambleton; Swaminathan; Rogers 1991, Orlando; Thissen 2000 aj.s

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

MEZIROČNÍ POSUN VE ZNALOSTECH ŽÁKŮ 2005/06 2011/12

MEZIROČNÍ POSUN VE ZNALOSTECH ŽÁKŮ 2005/06 2011/12 MEZIROČNÍ POSUN VE ZNALOSTECH ŽÁKŮ /06 /12 Zhoršují se znalosti českých žáků? Testování Stonožka v 9. ročnících se v letošním roce neslo na vlně očekávání výsledků, které nám mají říct, jak si současní

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

pracovní list studenta

pracovní list studenta Výstup RVP: Klíčová slova: pracovní list studenta Funkce Petra Směšná žák chápe funkci jako vyjádření závislosti veličin, umí vyjádřit funkční vztah tabulkou, rovnicí i grafem, dovede vyjádřit reálné situace

Více

TESTOVÁNÍ V PSYCHOLOGII

TESTOVÁNÍ V PSYCHOLOGII Martin Jelínek, Petr Květon, Dalibor Vobořil Seznamte se spolu s námi se základními principy stále více populární teorie odpovědi na položku (Item Response Theory IRT). Kniha, kterou právě držíte v ruce,

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

24.11.2009 Václav Jirchář, ZTGB

24.11.2009 Václav Jirchář, ZTGB 24.11.2009 Václav Jirchář, ZTGB Síťová analýza 50.let V souvislosti s potřebou urychlit vývoj a výrobu raket POLARIS v USA při závodech ve zbrojení za studené války se SSSR V roce 1958 se díky aplikaci

Více

určité kognitivní (poznávací) schopnosti, které umožňují řešit problémy, učit se, přizpůsobovat se, zobecňovat apod.

určité kognitivní (poznávací) schopnosti, které umožňují řešit problémy, učit se, přizpůsobovat se, zobecňovat apod. Inteligence určité kognitivní (poznávací) schopnosti, které umožňují řešit problémy, učit se, přizpůsobovat se, zobecňovat apod. schopnost efektivně zpracovávat informace, úspěšně se adaptovat v životě

Více

ADAPTIVITA INFORMAČNÍCH SYSTÉMŮ INFORMATION SYSTEM ADAPTIVITY

ADAPTIVITA INFORMAČNÍCH SYSTÉMŮ INFORMATION SYSTEM ADAPTIVITY ADAPTIVITA INFORMAČNÍCH SYSTÉMŮ INFORMATION SYSTEM ADAPTIVITY Roman Malo Mendelova zemědělská a lesnická univerzita v Brně Provozně ekonomická fakulta, Ústav informatiky, malo@pef.mendelu.cz Abstrakt Problematika

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké

Více

Metodický list pro první soustředění kombinovaného studia. předmětu Management ve finančních službách

Metodický list pro první soustředění kombinovaného studia. předmětu Management ve finančních službách Metodický list pro první soustředění kombinovaného studia předmětu Management ve finančních službách Název tematického celku: Základní koncepční přístupy a osobnost manažera Cíl: V návaznosti na poznatky

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Zákony hromadění chyb.

Zákony hromadění chyb. Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky

Více

TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA

TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA Ve zprávě komentujeme výsledky testování 8. a 9. ročníků základních škol a odpovídajících ročníků víceletých gymnázií. Toto testování

Více

TIM - Test pro Identifikaci nadaných žáků v Matematice Kreativita při řešení matematických úloh

TIM - Test pro Identifikaci nadaných žáků v Matematice Kreativita při řešení matematických úloh TIM - Test pro Identifikaci nadaných žáků v Matematice Kreativita při řešení matematických úloh Hynek Cígler, Michal Jabůrek, Dana Juhová, Šárka Portešová, Ondřej Straka Katedra psychologie, Fakulta sociálních

Více

Výsledky základní statistické charakteristiky

Výsledky základní statistické charakteristiky Výsledky základní statistické charakteristiky (viz - Vyhláška č. 343/00 Sb. o průběhu přijímacího řízení na vysokých školách a Vyhláška 76/004 Sb. kterou se mění vyhláška č. 343/00 Sb., o postupu a podmínkách

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Matematické modelování dopravního proudu

Matematické modelování dopravního proudu Matematické modelování dopravního proudu Ondřej Lanč, Alena Girglová, Kateřina Papežová, Lucie Obšilová Gymnázium Otokara Březiny a SOŠ Telč lancondrej@centrum.cz Abstrakt: Cílem projektu bylo seznámení

Více

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

Statistické řízení jakosti - regulace procesu měřením a srovnáváním Statistické řízení jakosti - regulace procesu měřením a srovnáváním Statistická regulace výrobního procesu (SPC) SPC = Statistical Process Control preventivní nástroj řízení jakosti, který na základě včasného

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Nejistota měření. Thomas Hesse HBM Darmstadt

Nejistota měření. Thomas Hesse HBM Darmstadt Nejistota měření Thomas Hesse HBM Darmstadt Prof. Werner Richter: Výsledek měření bez určení nejistoty měření je nejistý, takový výsledek je lépe ignorovat" V podstatě je výsledek měření aproximací nebo

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Přejímka jedním výběrem

Přejímka jedním výběrem Přejímka jedním výběrem Menu: QCExpert Přejímka Jedním výběrem Statistická přejímka jedním výběrem slouží k rozhodnutí, zda dané množství nějakých výrobků vyhovuje našim požadavkům na kvalitu, která je

Více

Příručka k měsíčním zprávám ING fondů

Příručka k měsíčním zprávám ING fondů Příručka k měsíčním zprávám ING fondů ING Investment Management vydává každý měsíc aktuální zprávu ke každému fondu, která obsahuje základní informace o fondu, jeho aktuální výkonnosti, složení portfolia

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Biostatistika Cvičení 7

Biostatistika Cvičení 7 TEST Z TEORIE 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový průměr je a) náhodná veličina, b) konstanta,

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Vážená paní ředitelko, vážený pane řediteli, milí kolegové,

Vážená paní ředitelko, vážený pane řediteli, milí kolegové, Vážená paní ředitelko, vážený pane řediteli, milí kolegové, v následující zprávě se Vám dostávají do rukou výsledky šetření klimatu Vašeho učitelského sboru. Můžete se tedy dozvědět, jak jsou u Vás ve

Více

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB 62 REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB BEZOUŠKA VLADISLAV Abstrakt: Text se zabývá jednoduchým řešením metody nejmenších čtverců v prostředí Matlab pro obecné víceparametrové aproximační funkce. Celý postup

Více

PISA 2012. SPŠ stavební J. Gočára, Družstevní ochoz 3, Praha 4. Kód vaší školy: M 2 VÝSLEDKY ŠETŘENÍ ŠKOLNÍ ZPRÁVA

PISA 2012. SPŠ stavební J. Gočára, Družstevní ochoz 3, Praha 4. Kód vaší školy: M 2 VÝSLEDKY ŠETŘENÍ ŠKOLNÍ ZPRÁVA VÝSLEDKY ŠETŘENÍ PISA 1 ŠKOLNÍ ZPRÁVA SPŠ stavební J. Gočára, Družstevní ochoz 3, Praha Kód vaší školy: M Tato zpráva je spolufinancována Evropským sociálním fondem a státním rozpočtem České republiky.

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Biostatistika a e-learning na Lékařské fakultě UK v Hradci Králové

Biostatistika a e-learning na Lékařské fakultě UK v Hradci Králové Univerzita Karlova v Praze Lékařská fakulta v Hradci Králové Ústav lékařské biofyziky Biostatistika a e-learning na Lékařské fakultě UK v Hradci Králové Josef Hanuš, Josef Bukač, Iva Selke-Krulichová,

Více

Přednáška č.7 Ing. Sylvie Riederová

Přednáška č.7 Ing. Sylvie Riederová Přednáška č.7 Ing. Sylvie Riederová 1. Aplikace klasifikace nákladů na změnu objemu výroby 2. Modelování nákladů Podstata modelování nákladů Nákladové funkce Stanovení parametrů nákladových funkcí Klasifikační

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Adaptivní test COMPACT

Adaptivní test COMPACT ajt 2012/1/10 0:08 page 1 #1 Masarykova univerzita Adaptivní test COMPACT Tamara Váňová Jiří Procházka Denisa Denglerová Brno 2012 ajt 2012/1/10 0:08 page 2 #2 Publikace vznikla v rámci projektu CZ.1.07/2.2.00/07.0442

Více

Tvorba kurzu v LMS Moodle

Tvorba kurzu v LMS Moodle Tvorba kurzu v LMS Moodle Před počátkem práce na tvorbě základního kurzu znovu připomínám, že pro vytvoření kurzu musí být profil uživatele nastaven administrátorem systému minimálně na hodnotu tvůrce

Více

Tvorba a struktura e-learningových kurzů. Pavel Kasal, Jitka Feberová Ústav lékařské informatiky 2. lékařská fakulta UK

Tvorba a struktura e-learningových kurzů. Pavel Kasal, Jitka Feberová Ústav lékařské informatiky 2. lékařská fakulta UK Tvorba a struktura e-learningových kurzů Pavel Kasal, Jitka Feberová Ústav lékařské informatiky 2. lékařská fakulta UK Prostředky elektronického vzdělávání Prezentace znalostí - atlasy -texty -záznamy

Více

Příručka k měsíčním zprávám ING fondů

Příručka k měsíčním zprávám ING fondů Příručka k měsíčním zprávám ING fondů ING Investment Management vydává každý měsíc aktuální zprávu ke každému fondu, která obsahuje základní informace o fondu, jeho aktuální výkonnosti, složení portfolia

Více

SCLPX 07 2R Ověření vztahu pro periodu kyvadla

SCLPX 07 2R Ověření vztahu pro periodu kyvadla Klasické provedení a didaktické aspekty pokusu U kyvadla, jakožto dalšího typu mechanického oscilátoru, platí obdobně vše, co bylo řečeno v předchozích experimentech SCLPX-7 a SCLPX-8. V současném pojetí

Více

pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Jak jsou vysocí? Mirek Kubera

pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Jak jsou vysocí? Mirek Kubera Výstup RVP: Klíčová slova: pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Mirek Kubera žák diskutuje a kriticky zhodnotí statistické informace a daná statistická sdělení, volí

Více

Ing. Petr Knap Carl Zeiss spol. s r.o., Praha

Ing. Petr Knap Carl Zeiss spol. s r.o., Praha METROTOMOGRAFIE JAKO NOVÝ NÁSTROJ ZAJIŠŤOVÁNÍ JAKOSTI VE VÝROBĚ Ing. Petr Knap Carl Zeiss spol. s r.o., Praha ÚVOD Společnost Carl Zeiss Industrielle Messtechnik GmbH již dlouhou dobu sleduje vývoj v poměrně

Více

VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu

VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu VÝUKOVÝ MATERIÁL Identifikační údaje školy Vyšší odborná škola a Střední škola, Varnsdorf, příspěvková organizace Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632

Více

Role experimentu ve vědecké metodě

Role experimentu ve vědecké metodě Role experimentu ve vědecké metodě Erika Mechlová Ostravská univerzita v Ostravě Obsah Úvod 1. Pozorování 2. Uvedení a formulace problému. Sbírání informací 3. Stanovení hypotéz řešení problému 4. Provedení

Více

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Zpracoval: www.scio.cz, s.r.o. (15. 2. 2012) Datové podklady: výsledky a dotazníky z PRO23, test čtenářské gramotnosti, www.scio.cz, s.r.o.

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE 1 Úvod Michal Dorda, Dušan Teichmann VŠB - TU Ostrava, Fakulta strojní, Institut dopravy Seřaďovací stanice jsou železniční

Více

FOTOVOLTAICKÉ SYSTÉMY S VÝCHODO-ZÁPADNÍ ORIENTACÍ A POUZE JEDNÍM MPP TRACKEREM

FOTOVOLTAICKÉ SYSTÉMY S VÝCHODO-ZÁPADNÍ ORIENTACÍ A POUZE JEDNÍM MPP TRACKEREM FOTOVOLTAICKÉ SYSTÉMY S VÝCHODO-ZÁPADNÍ ORIENTACÍ A POUZE JEDNÍM MPP TRACKEREM V minulosti panovala určitá neochota instalovat fotovoltaické (FV) systémy orientované východo-západním směrem. Postupem času

Více

Struktura e-learningových výukových programù a možnosti jejího využití

Struktura e-learningových výukových programù a možnosti jejího využití Struktura e-learningových výukových programù a možnosti jejího využití Jana Šarmanová Klíčová slova: e-learning, programovaná výuka, režimy učení Abstrakt: Autorská tvorba výukových studijních opor je

Více

Matematika. ochrana životního prostředí analytická chemie chemická technologie Forma vzdělávání:

Matematika. ochrana životního prostředí analytická chemie chemická technologie Forma vzdělávání: Studijní obor: Aplikovaná chemie Učební osnova předmětu Matematika Zaměření: ochrana životního prostředí analytická chemie chemická technologie Forma vzdělávání: denní Celkový počet vyučovacích hodin za

Více

Static Load Balancing Applied to Time Dependent Mechanical Problems

Static Load Balancing Applied to Time Dependent Mechanical Problems Static Load Balancing Applied to Time Dependent Mechanical Problems O. Medek 1, J. Kruis 2, Z. Bittnar 2, P. Tvrdík 1 1 Katedra počítačů České vysoké učení technické, Praha 2 Katedra stavební mechaniky

Více

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu Metoda Monte Carlo a její aplikace v problematice oceňování technologií Manuál k programu This software was created under the state subsidy of the Czech Republic within the research and development project

Více

Měřicí řetězec. měřicí zesilovač. převod na napětí a přizpůsobení rozsahu převodníku

Měřicí řetězec. měřicí zesilovač. převod na napětí a přizpůsobení rozsahu převodníku Měřicí řetězec fyzikální veličina snímač měřicí zesilovač A/D převodník počítač převod fyz. veličiny na elektrickou (odpor, proud, napětí, kmitočet...) převod na napětí a přizpůsobení rozsahu převodníku

Více

Přehled matematického aparátu

Přehled matematického aparátu Přehled matematického aparátu Ekonomie je směsí historie, filozofie, etiky, psychologie, sociologie a dalších oborů je tak příslovečným tavicím kotlem ostatních společenských věd. Ekonomie však často staví

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Sedm základních nástrojů řízení kvality Doc. RNDr. Jiří Šimek,

Více

Mikroekonomie. Minulá přednáška - podstatné. Náklady firmy v krátkém a dlouhém období. Důležité vzorce. Náklady v krátkém období - graficky

Mikroekonomie. Minulá přednáška - podstatné. Náklady firmy v krátkém a dlouhém období. Důležité vzorce. Náklady v krátkém období - graficky Minulá přednáška - podstatné Mikroekonomie Ing. Jaroslav ŠETEK, Ph.D. Katedra ekonomiky, JČU Typologie nákladů firmy Náklady v krátkém období Náklady v dlouhém období Důležité vzorce TC = FC + VC AC =

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Učitelé matematiky a CLIL

Učitelé matematiky a CLIL ŠULISTA Marek. Učitelé matematiky a CLIL. Učitel matematiky. Jednota českých matematiků a fyziků, 2014, roč. 23, č. 1, s. 45-51. ISSN 1210-9037. Učitelé matematiky a CLIL Úvod V České republice došlo v

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Výsledky dětí v testech, zkouškách a přijímacím řízení na vyšší stupeň

Výsledky dětí v testech, zkouškách a přijímacím řízení na vyšší stupeň Výsledky dětí v testech, zkouškách a přijímacím řízení na vyšší stupeň V rámci celé školy je zaveden systém sledování, jak žáci dosahují očekávaných výstupů. Na konci každého pololetí jsou v každé třídě

Více

Mezinárodní výzkum občanské výchovy ICCS 2009. Výzkumná zpráva ZŠ Jablonec nad Nisou

Mezinárodní výzkum občanské výchovy ICCS 2009. Výzkumná zpráva ZŠ Jablonec nad Nisou Mezinárodní výzkum občanské výchovy ICCS 2009 Výzkumná zpráva ZŠ Jablonec nad Nisou Ústav pro informace ve vzdělávání Senovážné nám. 26, P.O. Box 1, 06 Praha 1 Tato výzkumná zpráva předkládá výsledky mezinárodní

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Měřicí přístroje a měřicí metody

Měřicí přístroje a měřicí metody Měřicí přístroje a měřicí metody Základní elektrické veličiny určují kvalitativně i kvantitativně stav elektrických obvodů a objektů. Neelektrické fyzikální veličiny lze převést na elektrické veličiny

Více

Induktivní statistika. z-skóry pravděpodobnost

Induktivní statistika. z-skóry pravděpodobnost Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných

Více

Měření modulů pružnosti G a E z periody kmitů pružiny

Měření modulů pružnosti G a E z periody kmitů pružiny Měření modulů pružnosti G a E z periody kmitů pružiny Online: http://www.sclpx.eu/lab2r.php?exp=2 V tomto experimentu vycházíme z pojetí klasického pokusu s pružinovým oscilátorem. Z periody kmitů se obvykle

Více

SČÍTÁNÍ BEZDOMOVCŮ V PRAZE V ROCE 2010

SČÍTÁNÍ BEZDOMOVCŮ V PRAZE V ROCE 2010 SČÍTÁNÍ BEZDOMOVCŮ V PRAZE V ROCE 2010 Cíle výzkumu a aplikované metody Petr Holpuch CÍLE PROJEKTU CÍLE PROJEKTU Vytvoření takového metodického konceptu, který by umožňoval pravidelné získávání srovnatelných

Více

7. přednáška Systémová analýza a modelování. Přiřazovací problém

7. přednáška Systémová analýza a modelování. Přiřazovací problém Přiřazovací problém Přiřazovací problémy jsou podtřídou logistických úloh, kde lze obecně říci, že m dodavatelů zásobuje m spotřebitelů. Dalším specifikem je, že kapacity dodavatelů (ai) i požadavky spotřebitelů

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast CZ.1.07/1.5.00/34.0963 IV/2 Inovace a zkvalitnění výuky směřující k rozvoji matematické gramotnosti

Více

Kalibrace odporového teploměru a termočlánku

Kalibrace odporového teploměru a termočlánku Kalibrace odporového teploměru a termočlánku Jakub Michálek 10. dubna 2009 Teorie Pro označení veličin viz text [1] s výjimkou, že teplotní rozdíl značím T, protože značku t už mám vyhrazenu pro čas. Ze

Více

shine. light of change.

shine. light of change. shine. light of change. Jak rozpoznat, je-li člověk vhodný jako projektový manažer? Michael Motal Záměr Ukázat Iniciovat Jak podpořit rozhodování Jak zvážit smysluplnost investice do člověka Výměnu názorů

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

Souhrnné výsledky za školu

Souhrnné výsledky za školu XYZ třída počet žáků percentil skupinový percentil (G4) čistá úspěšnost skóre směrodatná odchylka skóre x geometrie funkce algebra třída počet žáků percentil skupinový percentil (G4) čistá úspěšnost skóre

Více

Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace

Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace České vysoké učení technické v Praze Fakulta elektrotechnická Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace Životnost LED diod Autor: Joel Matějka Praha, 2012 Obsah 1 Úvod

Více

Fázorové diagramy pro ideální rezistor, skutečná cívka, ideální cívka, skutečný kondenzátor, ideální kondenzátor.

Fázorové diagramy pro ideální rezistor, skutečná cívka, ideální cívka, skutečný kondenzátor, ideální kondenzátor. FREKVENČNĚ ZÁVISLÉ OBVODY Základní pojmy: IMPEDANCE Z (Ω)- charakterizuje vlastnosti prvku pro střídavý proud. Impedance je základní vlastností, kterou potřebujeme znát pro analýzu střídavých elektrických

Více

Národní informační středisko pro podporu jakosti

Národní informační středisko pro podporu jakosti Národní informační středisko pro podporu jakosti Stanovení měr opakovatelnosti a reprodukovatelnosti při kontrole měřením a srovnáváním Ing. Jan Král Úvodní teze Zásah do procesu se děje na základě měření.

Více

INVENTÁŘ MOTIVŮ, HODNOT A PREFERENCÍ

INVENTÁŘ MOTIVŮ, HODNOT A PREFERENCÍ INVENTÁŘ MOTIVŮ, HODNOT A PREFERENCÍ S T R U Č N Ý P Ř E H L E D ÚVOD Inventář motivů, hodnot a preferencí () odhaluje vnitřní hodnoty, cíle a zájmy člověka. Výsledky z inventáře odhalují jaký typ práce,

Více

P R O J E K T O V É Ř Í Z E N Í A M A R K E T I N G 1. Akad. rok 2015/2016, LS Projektové řízení a marketing - VŽ 1

P R O J E K T O V É Ř Í Z E N Í A M A R K E T I N G 1. Akad. rok 2015/2016, LS Projektové řízení a marketing - VŽ 1 P R O J E K T O V É Ř Í Z E N Í A M A R K E T I N G 1 Akad. rok 2015/2016, LS Projektové řízení a marketing - VŽ 1 Vznik a historie projektového řízení Akad. rok 2015/2016, LS Projektové řízení a marketing

Více

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Excel - pokračování Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Př. Analýza prodeje CD základní jednoduché vzorce karta Domů Př. Skoky do dálky - funkce

Více

2. Numerické výpočty. 1. Numerická derivace funkce

2. Numerické výpočty. 1. Numerická derivace funkce 2. Numerické výpočty Excel je poměrně pohodlný nástroj na provádění různých numerických výpočtů. V příkladu si ukážeme možnosti výpočtu a zobrazení diferenciálních charakteristik analytické funkce, přičemž

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

výchovy a sportu v testu 12minutového plavání

výchovy a sportu v testu 12minutového plavání Zpracovala: Pokorná Jitka Katedra plaveckých sportů UK FTVS Výkonnost studentů 1.. ročník níků Fakulty tělesné výchovy a sportu v testu 12minutového plavání Irena Čechovská, Barbora Čechovská, Gabriela

Více

Metody výběru ve výzkumech veřejného mínění

Metody výběru ve výzkumech veřejného mínění Metody výběru ve výzkumech veřejného mínění Populace (základní soubor) Soubor jednotek, o nichž předpokládáme, že jsou pro ně závěry výzkumu platné Někdy se rozlišuje: Cílová populace - všechny jednotky

Více

Centrum pro zjišťování výsledků vzdělávání CERMAT Jankovcova 933/63, 170 00 Praha 7, tel.: +420 224 507 507 www.cermat.cz, www.novamaturita.

Centrum pro zjišťování výsledků vzdělávání CERMAT Jankovcova 933/63, 170 00 Praha 7, tel.: +420 224 507 507 www.cermat.cz, www.novamaturita. Analýza výsledků testu - slovníček aktuálních pojmů. Úlohy zařazované do testů jsou různého typu. V uzavřených úlohách a uzavřených podúlohách svazku žák vybírá odpověď z několika nabízených alternativ.

Více

Přínos k rozvoji klíčových kompetencí:

Přínos k rozvoji klíčových kompetencí: Střední škola hospodářská a lesnická, Frýdlant, Bělíkova 1387, příspěvková organizace Název modulu Informační a komunikační Kód modulu ICT-M-4/1-5 technologie Délka modulu 60 hodin Platnost 1.09.2010 Typ

Více