Využití software ITEMAN k položkové analýze a analýze výsledků testů

Podobné dokumenty
Povídání o testech a jejich hodnocení. Martin Chvál

Výsledky základní statistické charakteristiky

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Výsledky základní statistické charakteristiky

Analýza dat na PC I.

Metodologie pro ISK II

MATEMATIKA III V PŘÍKLADECH

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

TECHNICKÁ UNIVERZITA V LIBERCI

Centrum pro zjišťování výsledků vzdělávání CERMAT Jankovcova 933/63, Praha 7, tel.:

Zápočtová práce STATISTIKA I

Číselné charakteristiky

TESTOVÁNÍ ZNALOSTÍ STŘEDOŠKOLSKÉ FYZIKY U STUDENTŮ 1.ROČNÍKŮ LÉKAŘSKÝCH FAKULT V ČR

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Metodologie pro Informační studia a knihovnictví 2

Tabulka 1. Výběr z datové tabulky

Popisná statistika. Komentované řešení pomocí MS Excel

Využití webového rozhraní při sběru dat z přijímacího řízení na Pedagogické fakultě Univerzity Karlovy v Praze. Marie Marková

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Metodologie pro Informační studia a knihovnictví 2

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Nejčastější chyby v explorační analýze

Statistika - charakteristiky variability

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Statistika pro geografy

Souběžná validita testů SAT a OSP

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

CZ.1.07/1.2.08/ Vyhledávání talentů pro konkurenceschopnost a práce s nimi. Závislost úspěšnosti v testu TP2 na známce z matematiky

Charakteristika datového souboru

Základy popisné statistiky

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Manuál pro zaokrouhlování


Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Simulace. Simulace dat. Parametry

Didaktické testy při výuce konstrukčních předmětů

SOUHRNNÁ ZPRÁVA T E S T O V Á N Í 8. ROČ N Í K Ů PRŮŘEZOVÁ TÉMATA

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

UŽIVATELSKÝ MANUÁL. Obecné informace pro uživatele a administrátory dotazníku. Abstraktní myšlení BASIC

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

SOUHRNNÁ ZPRÁVA PRO ŠKOLU Maturita nanečisto 2007 Výsledky zkoušek společné a profilové části maturitní zkoušky

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výsledky základní statistické charakteristiky

TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2014/2015 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Základy biostatistiky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Minimální hodnota. Tabulka 11

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA

UNIVERZITA PARDUBICE

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Příloha podrobný výklad vybraných pojmů

Inovace bakalářského studijního oboru Aplikovaná chemie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Korelace. Komentované řešení pomocí MS Excel

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základy pravděpodobnosti a statistiky. Popisná statistika

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

STATISTICKÉ CHARAKTERISTIKY

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Praktická statistika. Petr Ponížil Eva Kutálková

Pokročilé metody geostatistiky v R-projektu

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Testování informační gramotnosti - 9.třídy

Základní statistické charakteristiky

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

HODNOCENÍ VÝUKY STUDENTY PEDF UK ZS 2016/2017

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Analýza dat s využitím MS Excel

Základy popisné statistiky

Aplikovaná statistika v R

Didaktické testy pro výuku konstrukčních předmětů

Kontingenční tabulky v Excelu. Představení programu Statistica

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Pracovní text a úkoly ke cvičením MF002

Statistická analýza jednorozměrných dat

Výstupní testování studentů 4. ročníku

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Transkript:

11. konference ČAPV Sociální a kulturní souvislosti výchovy a vzdělávání Využití software ITEMAN k položkové analýze a analýze výsledků testů Petr Byčkovský, Marie Marková Postup při návrhu a ověření testu se běžně rozděluje do tří na sebe navazujících etap: plánování testu, konstrukce testu a analýza testových výsledků. Položková analýza je důležitou součástí posledních dvou etap. V etapě konstrukce při pilotáži úloh, které navrhovatel testu zamýšlí zařadit do finální verze testu, pomáhá při posuzování vhodnosti jednotlivých úloh, tím že, její výsledky mohou upozornit na úlohy, které jsou nejasně formulované, nebo mají více správných řešení než navrhovatel úlohy předpokládal. V závěrečné etapě pak umožňuje zjistit statistické charakteristiky úloh, především empiricky zjištěnou úspěšnost při řešení úlohy, jejich citlivost (označovanou též jako index diskriminace) a funkci nabízených odpovědí (správných a distraktorů). Součástí analýzy testu je také zjištění statistických charakteristik souboru testových skórů, které je zvlášť závažné tehdy, chceme-li zjistit vyrovnanost dvou nebo více variant testu. Položková analýza a analýza testových výsledků vyžaduje mnoho času zejména tehdy pokud ji provádíme u testů zadaných většímu počtu testovaných. Proto se při ní využívá různé software, které je součástí rozsáhlejšího statistického software (např. SPSS, Statistica) nebo software samostatného. Mezi samostatné software patří i ITEMAN, produkt firmy Assessment Systems Corporation (viz http://www.assess.com), který je více než 15 let využíván především v USA. Toto software jsme použili při analýze výsledků některých testů zadaných při přijímacím řízení v roce 2002 na Pedagogické fakultě Univerzity Karlovy v Praze. ITEMAN je jednoduché software, určené pro položkovou analýzu a analýzu výsledků testů sestavených z úloh s výběrem odpovědi. Data z testů mohou být snímána opticky nebo vkládána ručně pomocí počítače. Ruční vkládání dat je časově náročné, umožňuje však analyzovat i úlohy s krátkou tvořenou odpovědí, jednotlivé položky však musí vždy být skórovány binárně, tj. správná odpověď je hodnocena 1 bodem a nesprávná žádným bodem. Účelem příspěvku je charakterizovat zmíněný software a ilustrovat jeho využití na příkladech položkové analýzy a analýzy výsledků testu z biologie. Příspěvek bezprostředně navazuje na sdělení M. Markové Využití webového rozhraní při sběru dat z přijímacího řízení. 1. Vstupní formát dat Program ITEMAN vyžaduje, aby vstupní data určená k analýze byla v textovém souboru, který bude ve formátu ASCII (pouze text). Příklad vstupního souboru dat je na obr.1. Obr. 1 Příklad vstupního souboru obsahujícího binárně skórované položky 30 O N 5 143534243521132435241342351423 KEY 555555555555555555555555555555 NO. ALTERNATIVES YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY ITEMS TO INCLUDE EX001543542143554321542345134332413 EXAMINEE #1 EX002143534244522133OO2542531342513 EXAMINEE #2 EX003143534223521132435244342351233 EXAMINEE #3 EX004143534243521132435241342352NNN EXAMINEE #4 EX005143534243412132435452132341323 EXAMINEE #5

První čtyři řádky textového souboru charakterizují analyzovaný test. V prvním řádku udáváme počet úloh v testu, definujeme znak pro vynechané odpovědi (O), nedosažené úlohy (N) a počet znaků identifikující test. Z obr. 1 je zřejmé, že analyzovaný test obsahuje 30 úloh a každý test je identifikovaný pěti znaky. Do druhého řádku se zaznamenává klíč správných odpovědí, do třetího řádku počet nabízených odpovědí a do čtvrtého řádku uvádíme, které úlohy zahrneme do analýzy (Y zahrnuto). ITEMAN dovoluje analyzovat testy sestavené až ze 750 úloh a neomezuje počet testovaných. V každém z následujících řádků se uvádí identifikace testovaného a jeho odpovědi na jednotlivé testové úlohy. 2. Položková analýza Prvním ze dvou výstupů programu ITEMAN jsou výsledky položkové analýzy.výstup ze software ITEMAN je v angličtině, uvádíme proto i překlad názvů statistických ukazatelů: Pořadové číslo úlohy Seq. No. Pořadové číslo úlohy u subtestu (pokud je test na subtesty dělen) Scale Item Podíl nebo procento (uživatel si volí) správných odpovědí Prop. Correct Citlivost úlohy (rozdíl mezi úspěšností lepší a horší skupiny) Disc. Index Korelace úspěšnosti v úloze s testovými skóry pomocí buď bodově biseriálního korelačního koeficientu Point. Biser. nebo biseriálního korelačního koeficientu (uživatel si volí) Biser. Podíl voleb jednotlivých nabízených odpovědí v úloze celkem Prop. Total u horší skupiny (27% s nejnižšími skóry v testu) Endorsing Low u lepší skupin (27% s nejvyššími skóry v testu) Endorsing High Podíl jiných odpovědí (např. vynechaných) Other Korelace mezi nabízenými odpověďmi a testovými skóry Point. Biser. Správná odpověď (označení) Key (*) Ukázka výstupu s výsledky položkové analýzy prvních tří úloh testu z biologie, který byl použit u přijímacího řízení na Pedagogické fakultě UK v roce 2002 je na obr. 2. Obr. 2 Výsledky položkové analýzy tří úloh testu z biologie Item Statistics Alternative Statistics ----------------------- ---------------------------------- Seq. Scale Pcnt Disc. Point Pcnt Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ --- 1 0-1 77.29.28 A 7 14 3 -.16 B 13 18 10 -.10 C 77 57 86.28 * D 3 11 0 -.27 Other 0 0 0 2 0-2 30.30.40 A 13 14 14.02 B 33 39 10 -.32 C 24 29 28 -.09 D 30 18 48.40 * Other 0 0 0 3 0-3 35.41.44 A 14 25 3 -.21 B 25 39 21 -.20 C 23 14 14 -.07 D 35 18 59.44 * Other 2 0 0 -.15

3. Analýza testových výsledků Účelem analýzy testových výsledků je zjistit statistické charakteristiky testů a v případě, kdy používáme několika variant testu tyto charakteristiky porovnat a tím zjistit, zda jsou varianty srovnatelné. ITEMAN zjišťuje následující statistické charakteristiky: Počet testovaných N of Examinees Průměrný hrubý skór Mean Rozptyl skórů Variance Směrodatná odchylka skórů Std. Dev. Šikmost rozložení skórů Skew Špičatost rozložení Kurtosis Nejnižší dosažený skór Minimum Nejvyšší dosažený skór Maximum Medián (prostřední skór) Median Reliabilita (Cronbachovo alfa) Alpha Směrodatná chyba měření SEM Relativní průměrný skór Mean P Průměrný bodově biseriální koeficient Mean Item-Tot. Průměrný biseriální koeficient Mean Biserial Nejvyšší skór dosažený skupinou 27% testovaných s nejnižšími skóry Max Score (Low) (horší skupina) Počet testovaných v horší skupině N (Low Group) Minimální skór dosažený skupinou 27% testovaných s nejvyššími skóry Min Score (High) (lepší skupina) Počet testovaných v lepší skupině N (High Group) Hrubý skór (počet správných odpovědí) Number Correct Četnost testovaných podle počtu správných odpovědí Freqvency Kumulativní četnost Cum Freqvency Percentil odpovídající hrubému skóru PR Relativní četnost PCT Histogram skórů založený na relativních četnostech Ukázka výstupu obsahujícího základní statistické charakteristiky testu z biologie obsahujícího 25 úloh, který byl použit při přijímacím řízení v roce 2002, je na obr. 3. Obr. 3 Statistické charakteristiky varianty B testu z biologie N of Items 25 N of Examinees 91 Mean 14.396 Variance 12.305 Std. Dev. 3.508 Skew 0.400 Kurtosis 0.273 Minimum 5.000 Maximum 24.000 Median 14.000 Alpha 0.619 SEM 2.165 Mean Pcnt Corr 58 Mean Item-Tot. 0.322 Mean Biserial 0.437 Max Score (Low) 12 N (Low Group) 28 Min Score (High) 16 N (High Group) 29

Na obr. 4 je histogram a četnosti skórů varianty B testu z biologie, jehož statistické charakteristiky byly uvedeny na obr. 3. Obr. 4 Histogram skórů varianty B testu z biologie Number Freq- Cum Correct uency Freq PR PCT ------- ------- ------ ---- ----... No examinees below this score... 4 0 0 1 0 5 1 1 1 1 +# 6 0 1 1 0 7 0 1 1 0 8 1 2 2 1 # 9 3 5 5 3 ### 10 5 10 11 5 +##### 11 9 19 21 10 ########## 12 9 28 31 10 ########## 13 11 39 43 12 ############ 14 9 48 53 10 ########## 15 14 62 68 15 +############### 16 6 68 75 7 ####### 17 9 77 85 10 ########## 18 3 80 88 3 ### 19 3 83 91 3 ### 20 1 84 92 1 +# 21 3 87 96 3 ### 22 2 89 98 2 ## 23 1 90 99 1 # 24 1 91 99 1 # 25 0 91 99 0 + ----+----+----+----+----+ 5 10 15 20 25 4. Využití výsledků analýzy při posuzování vyrovnanosti testových variant K závažným úkolům analýzy testových výsledků je posoudit zda, testové varianty jsou vyrovnané. Na obr. 5 uvádíme porovnání statistických charakteristik varianty A a varianty B testu z biologie. Obr. 5 Statistické charakteristiky variant A a B testu z biologie Varianty A B Počet úloh 25 25 Počet testovaných 101 91 Průměrný hrubý skór 13,92 14,40 Rozptyl skórů 10,68 12,31 Směrodatná odchylka skórů 3,27 3,51 Šikmost rozložení 0,04 0,40 Špičatost rozložení -0,67 0,27 Nejnižší dosažený skór 7,00 5,00 Nejvyšší dosažený skór 21,00 24,00 Medián (prostřední skór) 14,00 14,00 Reliabilita (Cronbachovo alfa) 0,55 0,62 Směrodatná chyba měření 2,19 2,17 Relativní průměrný skór 56 58 Průměrný bodově biseriální koeficient 0,29 0,32 Průměrný biseriální koeficient 0,40 0,44 Nejvyšší skór dosažený skupinou 27% testovaný (horší skupina) 12 12 Počet testovaných v horší skupině 37 28 Minimální skór dosažený skupinou 27% testovaných s nejvyššími skóry (lepší 16 16 skupina) Počet testovaných v lepší skupině 34 29

Při srovnání jednotlivých statistických charakteristik si můžeme všimnout, že většina charakteristik je vyrovnaná. Varianta B je však poněkud snadnější a citlivější než varianta A, a její reliabilita, i když není příliš vysoká (Cronbachovo alfa 0,62), je vyšší než reliabilita varianty B. Nedostatečná reliabilita obou variant však je zřejmým nedostatkem obou variant analyzovaného testu, především pak proto, že výsledky testu jsou podkladem pro závažné rozhodnutí. Výsledky položkových analýz a analýz výsledků testů, použitých při přijímacích zkouškách na Pedagogickou fakultu Univerzity Karlovy v roce 2002 jsme poskytli autorům testů, kteří je využili ke zdokonalení testů určených pro přijímací zkoušky v následujícím roku.