VALIDIZACE VÝBĚROVÝCH ŘÍZENÍ: MOŽNOSTI VYUŽITÍ HIERARCHICKÝCH LINEÁRNÍCH MODELŮ

Podobné dokumenty
VALIDATION OF CONCEPTUAL ASSESSMENTS AND ADMISSION TESTS FOR MEDICAL SCHOOLS

Modely přidané hodnoty škol

AKTIVNÍ ZAPOJOVÁNÍ STUDENTŮ DO VÝUKY STATISTIKY A PSYCHOMETRIE: ZKUŠENOSTI Z USA

Vzdělávání v Biomedicínské a Zdravotnické Informatice

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

U oborů s výučním listem se nebudou konat přijímací zkoušky. Žáci budou přijímáni na základě výsledků

Metodologie pedagogického výzkumu II

ACGA: Anglicko-české gymnázium AMAZON. Potvrzení zájmu přijatého uchazeče o školu se provádí zápisovým lístkem.

ACGA: Anglicko-české gymnázium AMAZON. Potvrzení zájmu přijatého uchazeče o školu se provádí zápisovým lístkem.

VYHLÁŠENÍ PRVNÍHO KOLA PŘIJÍMACÍHO ŘÍZENÍ

s.r.o. Zpracovali Jan Synek, Václav Otřísal 15. září 2008

ACGA: Anglicko-české gymnázium AMAZON. Potvrzení zájmu přijatého uchazeče o školu se provádí zápisovým lístkem.

Příloha k materiálu pro výjezdní KD Interní materiál nepřikládat k zápisu

LINEÁRNÍ MODELY. Zdeňka Veselá

Výsledky základní statistické charakteristiky

Fulbrightova stipendia pro studium a výzkum v USA

KRITÉRIA A POŽADAVKY PRO PŘIJÍMACÍ ŘÍZENÍ

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Statistická analýza jednorozměrných dat

Statistická analýza dat

Měření přidané hodnoty škol v Anglii

INFORMACE PRO ŘÍDÍCÍ PRACOVNÍKY VE ŠKOLSTVÍ

Využití software ITEMAN k položkové analýze a analýze výsledků testů

Zpráva o přijímacím řízení na Fakultě elektrotechnické ZČU v Plzni v ak. roce 2012/13

Přijímací řízení na střední školy ve školním roce pro školní rok

Vyhlášení 2. kola přijímacího řízení SOŠ pro školní rok 2013/2014

katedra statistiky PEF, Vysoká škola zemědělská, Praha 6 - Suchdol

Fulbrightova stipendia VŠCHT 24. června 2017

Vyhláška děkanky č. 6/2009

7. RP EU. Národní kontakt : Ing. Emil Kraemer, PhD Technologické centrum AV ČR Tel.:

Kritéria kvality výzkumu "Malá reliabilita zakrývá, nedostatečná validita znetvořuje."

Střední škola služeb, obchodu a gastronomie Hradec Králové

Evaluace středních škol

Jak dál v hodnocení a financování vědy: doporučení mezinárodního auditu

MODERNÍ DIAGNOSTIKA V NÁBORU A VÝBĚRU

Metody vícekriteriálního rozhodování a HTA. Josef Jablonský VŠE Praha

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

PROBLÉMY DALŠÍHO VZDĚLÁVÁNÍ V ČR

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Faktory ovlivňující efektivitu vzdělávání. PhDr. Markéta Šnýdrová, PhD.

Přehled statistického zpracování dat. Matúš Šucha, Dana Černochová, Lenka Šrámková, Vlasta Rehnová, Petr Zámečník

Zpráva o přijímacím řízení na Fakultě elektrotechnické ZČU v Plzni v ak. roce 2013/14

PŘIJÍMACÍ ŘÍZENÍ NA STŘEDNÍ ŠKOLY VE ŠKOLNÍM ROCE

Hodnocení projektů a návody pro žadatele - IEF, IOF, IIF (Akce Marie Curie) Ing. Emil Kraemer, PhD. Tel.: kraemer@tc.

Kritéria přijímacího řízení

PŘÍLOHA 1 - FORMULÁŘ PRŮZKUMU. Formulář průzkumu Public relations v českých knihovnách 2015

Blanka Jankovská Univerzitní knihovna Pardubice. 19. září 2013, Aula UK, Praha - Jinonice

Statistická analýza jednorozměrných dat

VYHLÁŠKA DĚKANA FAV 3D/2016. Přijímací řízení do navazujících studijních programů Fakulty aplikovaných věd pro ak. rok 2016/2017

ANALÝZA SIGNÁLŮ SPOJITÉ AKUSTICKÉ EMISE

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

DISEMINAČNÍ AKCE E1 ROUND TABLE - EVALUATION OF PILOT TESTING I (KULATÝ STŮL K PILOTNÍMU TESTOVÁNÍ

Vyhlášení prvního kola přijímacího řízení SOŠ pro školní rok 2012/2013

Fulbrightova stipendia. Karlova Univerzita v Praze březen 2017

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

Copyright 2011, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 8

Souběžná validita testů SAT a OSP

Kritéria pro přijímací řízení na Gymnáziu, Vodňany, Bavorovská 1046 pro školní rok 2015/2016

Zkušenosti s použitím metod Counterfactual Impact Evaluation při evaluaci ESF v České republice. Jan Brůha IREAS

Spolupráce vysokých škol s absolventy. Ing. Roman Kozel, Ph.D. proděkan Ekonomické fakulty VŠB TU Ostrava

Teorie a politika pracovního trhu. Kombinované studium Jaro 2013

Podmínky pro přijetí ke studiu na ESF MU do bakalářských a navazujících magisterských studijních programů pro akademický rok 2015/2016

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Prof. Mgr. Iveta Hashesh, PhD., MBA prorektorka pro strategii, inovace a kvalitu vzdělávání hashesh@edukomplex.cz

Vliv konzumace alkoholu na riziko vzniku rakoviny v české populaci

PŘIJÍMACÍ ŘÍZENÍ PRO ŠKOLNÍ ROK 2019/2020

Zpráva o přijímacím řízení na Fakultě elektrotechnické ZČU v Plzni v ak. roce 2015/16

Zpráva o přijímacím řízení na Fakultě elektrotechnické ZČU v Plzni v ak. roce 2014/15

Úvod do studia a života na vysoké škole - vysoká škola, věda, hodnocení a financování. Informace pro nové studenty Přírodovědecké fakulty JU

Směrnice č. 005/2015 upravující pravidla pro přijímací řízení do studijních programů v akademickém roce 2015/2016 na B.I.B.S., a.s.

Open-source Business Intelligence software: vnímání klíčových faktorů ve firmách v ČR. Ing. Radek Němec VŠB TU Ostrava Ekonomická fakulta

HODNOCENÍ UKONČENÝCH IPN

Střední školy hledají a nalézají cesty, jak podpořit žáky s OMJ při studiu. Mgr. Michaela Jiroutová

Zpráva o přijímacím řízení na Fakultě elektrotechnické ZČU v Plzni v ak. roce 2004/05

INFORMACE PRO ŘÍDÍCÍ PRACOVNÍKY VE ŠKOLSTVÍ

Využití indikátorů při hodnocení spravedlivosti vzdělávacích systémů

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Karta předmětu prezenční studium

Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. a.s. Ž Ď Á R N A D S Á Z A V O U VÝZVA

Kritéria přijímacího řízení pro školní rok 2017/18

Kvalita a efektivita vzdělávání z pohledu vzdělávacích výsledků. PhDr. Ondřej Andrys, MAE, MBA náměstek ústředního školního inspektora

INFORMACE O STUDIU (čtyřleté gymnázium)

Základní statistické charakteristiky písemných testů

Fulbrightův program - nástroj akademických výměn i podpora internacionalizace. Hana Ripková Andrea Semancová Kateřina Kloubová

Přijímací řízení na střední školy 2016/2017

Finanční a pojistná matematika. Den otevřených dveří 6. ledna 2012

5.1 Vyhlášení prvního kola přijímacího řízení SOŠ pro školní rok 2016/2017

Vyhlášení třetího kola přijímacího řízení SOŠ pro školní rok 2014/2015

Informace k přijímacím zkouškám Pilotní ověřování organizace přijímacího řízení do oborů s maturitní zkouškou s centrálními testy

KRITÉRIA PŘIJÍMACÍHO ŘÍZENÍ DO 1. ROČNÍKU VZDĚLÁVÁNÍ V GYMNÁZIU obor vzdělání K/41 Gymnázium V DENNÍ FORMĚ PRO ŠKOLNÍ ROK 2009/2010

Měření finanční gramotnosti v PISA 2012

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Výsledky aplikace kvantitativních metod CIE na OP LZZ, oblast podpory 1.1. Workshop č října 2012

KVALITA V KARIÉROVÉM PORADENSTVÍ

Doporučení České školní inspekce pro práci škol, školských zařízení a jejich zřizovatelů

VYHLÁŠKA DĚKANA FAV 2D/2018 PŘIJÍMACÍ ŘÍZENÍ DO NAVAZUJÍCÍCH STUDIJNÍCH PROGRAMŮ FAKULTY APLIKOVANÝCH VĚD PRO AK. ROK 2018/2019

KRITÉRIA PŘIJÍMACÍHO ŘÍZENÍ DO 1. ROČNÍKU VZDĚLÁVÁNÍ V GYMNÁZIU obor vzdělání K/41 Gymnázium V DENNÍ FORMĚ PRO ŠKOLNÍ ROK 2010/2011

7. RP EU. Národní kontakt : Ing. Emil Kraemer, PhD Technologické centrum AV ČR Tel.: kraemer@tc.cas.cz

Transkript:

VALIDIZACE VÝBĚROVÝCH ŘÍZENÍ: MOŽNOSTI VYUŽITÍ HIERARCHICKÝCH LINEÁRNÍCH MODELŮ Patrícia Martinková Ústav informatiky AV ČR Dan Goldhaber Center for Education Data & Research University of Washington, Bothel Konference ČAPV, 16. září 2015, Plzeň

Úvod 1 Projekty: Fulbright-Masarykovo stipendium, 2013 14 - Center for Statistics and the Social Sciences, University of Washington, USA - projekt Generalizing psychometric frameworks for estimating the quality of psychological, educational and health measurements Projekt financovaný IES (Institue of Education Sciences) - Applicants at the Doorstep: Improving Hiring Practices through a Better Understanding of the Link between Applicant Information and Teacher Quality - Researcher Practitioner grant (CEDR a školský distrikt Spokane, WA, USA) Juniorský projekt GA ČR 2015 2017 - Odhad psychometrických vlastností jako součást vývoje přijímacích testů

Úvod 2 Publikace - Goldhaber, Grout & Huntington-Klein: Screen Twice, Cut Once: Assessing the Predictive Validity of Teacher Selection Tools. CEDR WP #2014-9 - Martinková & Goldhaber: Improving Teacher Selection: The Effect of Intra-Rater Reliability in the Screening Process. CEDR WP #2015-7 - Martinková & Vlčková: Hodnocení reliability znalostních a psychologických testů. Informační bulletin České statistické společnosti, 25(4), 2014, str. 1-15. Prezentace - Association of Educational Finance and Policy (AEFP 2015), Washington D.C. - Joint Statistical Meetings (JSM 2015), Seattle

Úvod: Důležitost přijímacích řízení 3 Přijímací řízení je klíčovým momentem pro uchazeče i instituci: Kvalita uchazeče ovlivňuje kvalitu školy a naopak Stanovením kritérií pro přijetí vyvíjí škola tlak na kvalitu a přípravu uchazečů

Úvod: Zajištění efektivity přijímacích řízení 4 Zajištění co největšího počtu kvalitních uchazečů Vysoká validita hodnocení - Hodnocení dobře predikuje budoucí kvality uchazeče Vysoká reliabilita hodnocení - Hodnocení stejného uchazeče pro stejný typ pozice jsou konzistentní Strukturovanost Dobře stanovená a popsaná kritéria hodnocení Vícestupňové řízení (při vysokém počtu uchazečů)

Úvod: Cíle prezentace (osnova) 5 Případová studie: strukturované vícestupňové výběrové řízení na ZŠ/SŠ v oblasti Spokane, USA Prokazování validity hodnocení uchazečů - Především s ohledem na přidanou hodnotu učitele (teacher value added) Odhad inter-rater reliability hodnocení ve složitějších designech - Velké množství hodnotitelů - Design není vyvážený - Velké množství kovariát, které mohou ovlivnit reliabilitu hodnocení - Typ školy (ZŠ/SŠ) - Typ uchazeče (interní/externí) - Typ hodnotitele (zkušený/nezkušený) - Vliv reliability na validitu hodnocení Diskuse: možnosti uplatnění prezentovaných metod v ČR

Výběr učitelů - Spokane, USA

Uchazeči 7 Uchazeči o učitelské pozice v školském distriktu Spokane, 2008/09 2012/13

54-bodová rubrika 8 Vzdělání a certifikáty Praxe (Training) Zkušenosti (Experience) Vedení třídy (Classroom management) Flexibilita Instruktážní dovednosti Interpersonální dovednosti Kulturní kompetence Preferované kvalifikace Pozn.: V roce 2013 se objevuje navíc kritérium Kvalita doporučujících dopisů

9 Korelace, faktorová analýza

Validita výběrového řízení Goldhaber, Grout & Huntington-Klein: Screen Twice, Cut Once: Assessing the Predictive Validity of Teacher Selection Tools. CEDR WP #2014-9

Predikční validita výběrového řízení 11 Goldhaber et al. (2014) ukazují, že skóre v rubrikách je asociováno s 1. Přidanou hodnotou (Value-added) učitele 2. Pravděpodobností změny školy Z jednotlivých kritérií jsou prediktivní obzvláště: - Vedení třídy, Flexibilita, Instruktážní dovednosti, Výcvik Analýzy zahrnují uchazeče/učitele, kteří nebyli přijati v distriktu Spokane, ale byli přijati v jiném distriktu ve státě Washington Analýzy se vypořádávají s možným výběrovým zkreslením (selection bias) pomocí tzv. instrumentální proměnné - Chyby v součtech použity jako instrumentální proměnná

Inter-Rater Reliabilita Martinková & Goldhaber: Improving Teacher Selection: The Effect of Intra-Rater Reliability in the Screening Process. CEDR WP #2015-7

13 Hodnocení Inter-Rater Reliability: Data

14 Motivace: (Ne)konzistence hodnocení

15 Motivace: (Ne)konzistence hodnocení

16 Motivace: (Ne)konzistence hodnocení

Inter-rater reliabilita: Struktura dat 17 3986 hodnocení (vyplněných formulářů) 1177 uchazečů - hodnoceni 1-25 krát - hodnoceni pro 1-17 škol - interní a externí 141 hodnotitelů - hodnotili 1-99 times - hodnotili uchazeče pro 1-8 škol 526 inzerátů na 54 školách - ZŠ, SŠ - 15 typů pozic (ZŠ: třídní, SŠ: matematika, angličtina, )

Inter-rater reliabilita: Cíle 18 Odhad Inter-Rater Reliability - Globálně, na úrovni škol, na úrovni inzerátů - Porovnat IRR pro jednotlivé komponenty Testovat, co může způsobovat nekonzistence - Vhodnost uchazeče pro danou školu (resp. pro daný inzerát) - Je IRR menší pro externí uchazeče? - Je IRR menší pro SŠ než pro ZŠ? Implikace - Jak lze zvýšit reliabilitu pomocí průměrování více hodnotitelů - Jak lze zvýšit predikční validitu

Odhad Inter-Rater Reliability 19 Tradiční odhady: - Založené na korelačním koeficientu nebo - Založené na analýze rozptylu - Vyžadují vyvážený a poměrně jednoduchý design Náš přístup: - Hierarchické lineární modely (modely se smíšenými efekty) pomocí knihovny lme4 v statistickém prostředí R - Odhady metodou reziduální max. věrohodnosti - Parametrický bootstrap pro výpočet 95% konf. int. IRR - Výběr optimálního modelu pomocí BIC

Odhad IRR: Napříč školami 20 Model: Y ij = μ + A i + B j + e ij Efekt uchazeče A i N(0, σ 2 A ) Efekt hodnotitele B j N(0, σ 2 B ) Náhodná chyba e ij N(0, σ 2 e ) Reliabilita: R = variance skutečných skórů celková variance = σ A 2 σ A 2 + σ B 2 + σ e 2

Odhad IRR: Uvnitř jednotlivých škol 21 Model na úrovni jednotlivých škol: Y ijk = μ + A i + B j + AS ik + e ijk Reliabilita: R = variance skutečných skórů celková variance = σ 2 2 A + σ AS σ 2 A + σ 2 B + σ 2 2 AS + σ e

Odhad IRR: Uvnitř výběrových řízení 22 Model na úrovni jednotlivých výběrových řízení (inzerátů): Y ijkl = μ + A i + B j + AS ik +AJ il +e ijkl Reliabilita: R = variance skutečných skórů celková variance = σ 2 A + σ 2 2 AS + σ AJ σ 2 A + σ 2 B + σ 2 AS + σ 2 2 AJ + σ e

Odhad IRR na třech úrovních 23 3. Uvnitř jednotlivých výběrových řízení (inzerátů) 2. Uvnitř jednotlivých škol 1. Globální (napříč školami)

Odhad IRR: Komponenty 24 - Pro všechny komponenty jsou hodnocení závislé na škole, často i na výb. řízení (posuzováno dle BIC pro jednotlivé modely) - Některé komponenty jsou míň spolehlivé než jiné (např. Kulturní kompetence vs. Instruktážní dovednosti)

Co způsobuje nízkou IRR? 25 Typ školy: nižší Inter-Rater Reliabilita pro SŠ

Co způsobuje nízkou IRR? 26 Typ uchazeče: nižší Inter-Rater Reliabilita pro externí uchazeče

Možnosti zvýšení inter-rater reliability 27 - Průměrování dvou a více hodnotitelů - Dva hodnotitelé stačí k zvýšení IRR na 0,65 u některých komponent - Tři hodnotitelé stačí ke zvýšení IRR na 0,80 - Trénink a certifikace hodnotitelů - Zveřejnění kritérií těm, kdo píší doporučující dopisy - Důvěrnost doporučujících dopisů - Přidání desetinného místa

Přímý vliv na predikční validitu 28 - Vysoká reliabilita je nutnou podmínkou pro validitu - Kulturní kompetence - Vyšší reliabilita nezaručuje lepší predikční schopnost - Instruktážní schopnosti vs. Vedení třídy (Classroom management) - Průměrování dvou hodnotitelů zvýší korelaci s přidanou hodnotou učitele (value added) asi o 20%

Závěry, diskuse

Závěry, diskuse 30 Přijímací řízení je klíčovým momentem pro instituci i uchazeče Strukturované přijímací řízení s jasně stanovenými kritérii má potenciál predikovat úspěšnost uchazeče Predikční validita je úzce svázaná s konzistencí hodnotitelů (IRR) K odhadu reliability ve složitějších designech lze využít hierarchických (smíšených lineárních) modelů Další využití: - Ústní pohovory a další hodnocení v přijímacích zkouškách na VŠ - Observační hodnocení učitelů, studentů, škol - Hodnocení návrhů projektů GA ČR aj.

Děkuji za pozornost! Dotazy, náměty? martinkova@cs.cas.cz www.cs.cas.cz/martinkova

Reference - Goldhaber, Grout & Huntington-Klein: Screen Twice, Cut Once: Assessing the Predictive Validity of Teacher Selection Tools. CEDR WP #2014-9 - Martinková & Goldhaber: Improving Teacher Selection: The Effect of Intra-Rater Reliability in the Screening Process. CEDR WP #2015-7 - Martinková & Vlčková: Hodnocení reliability znalostních a psychologických testů. Informační bulletin České statistické společnosti, 25(4), 2014, str. 1-15. www.cs.cas.cz/martinkova

BACKUP SLIDES

Data Overview 34 Spokane Public Schools: applicant profile data, screening scores, record of job applications and status, and teacher absence data from 2008-09 to 2012-13 SYs (4 years of applicant data) Washington State OSPI - S-275 personnel records for certificated public school positions - PESB certification and licensure exam records - Core Student Record System: student achievement, demographic and assignment information NCES: school and district-level data WSIPC: teacher absence data for other districts (date and type)

35 Data Collected During Application Process