Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky



Podobné dokumenty
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

REGRESNÍ ANALÝZA. 13. cvičení

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Regresní a korelační analýza

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

7. Analýza rozptylu jednoduchého třídění

Staré mapy TEMAP - elearning

STATISTIKA (pro navazující magisterské studium)

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

Tomáš Karel LS 2012/2013

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

Ilustrační příklad odhadu LRM v SW Gretl

Využití logistické regrese pro hodnocení omaku

PRAVDĚPODOBNOST A STATISTIKA

Statistická analýza jednorozměrných dat

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

POROVNÁNÍ MEZI SKUPINAMI

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Jednofaktorová analýza rozptylu

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Analýza závislosti veličin sledovaných v rámci TBD

Digitální přenosové systémy a účastnické přípojky ADSL

Bodové a intervalové odhady parametrů v regresním modelu

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

Regresní a korelační analýza

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Regresní a korelační analýza

Přednáška č. 11 Analýza rozptylu při dvojném třídění

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

ANALÝZA PRODUKCE OLEJNIN ANALYSIS OF OIL SEED PRODUCTION. Lenka Šobrová

ALGORITMUS SILOVÉ METODY

Testování statistických hypotéz

Testování hypotéz. 4. přednáška

Regresní a korelační analýza

MODELOVÁNÍ A SIMULACE

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Teoretické modely diskrétních náhodných veličin

Jednofaktorová analýza rozptylu

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Statistická šetření a zpracování dat.

PRAVDĚPODOBNOST A STATISTIKA

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

4ST201 STATISTIKA CVIČENÍ Č. 7

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

Testy statistických hypotéz

Vysoká škola báňská - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky LOGICKÉ OBVODY pro kombinované a distanční studium

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

4EK211 Základy ekonometrie

6 LINEÁRNÍ REGRESNÍ MODELY

LOGICKÉ OBVODY J I Ř Í K A L O U S E K

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Neřešené příklady k procvičení

Úvod do analýzy rozptylu

11 Tachogram jízdy kolejových vozidel

Teorie efektivních trhů (E.Fama (1965))

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Matematika I A ukázkový test 1 pro 2018/2019

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

You created this PDF from an application that is not licensed to print to novapdf printer (

= = 2368

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Teoretické modely diskrétních náhodných veličin

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

MOŽNOSTI PREDIKCE DYNAMICKÉHO CHOVÁNÍ LOPAT OBĚŽNÝCH KOL KAPLANOVÝCH A DÉRIAZOVÝCH TURBÍN.

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

KORELACE. Komentované řešení pomocí programu Statistica

Regresní a korelační analýza

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

Výslednice, rovnováha silové soustavy.

NUMERICAL INTEGRATION AND DIFFERENTIATION OF SAMPLED TIME SIGNALS BY USING FFT

Transkript:

Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková

Prohlášení Prohlašuj, že jsem bakalářskou prác vypracovala samostatně za použtí pramenů uvedených v lteratuře. V Plzn dne 9. května 13 Tereza Pazderníková

Poděkování Velm ráda bych poděkovala vedoucímu práce Mgr. Mchalu Freslov, Ph.D. za odborné vedení, poskytnutí dat, nformací, materálů, cenných rad, užtečných přpomínek a vstřícné jednání během vytváření bakalářské práce. Dále bych ráda poděkovala všem, kteří mě během mého studa podporoval.

bstrakt Práce se zabývá statstckým zpracováním výsledků vstupních testů z matematky. Tyto testy slouží pro srovnání vstupních znalostí studentů fakult Západočeské unverzty v Plzn a jsou prováděny každoročně od roku 6. Cílem práce je zaměřt se na souvslost výsledku testu se studovaným oborem a zhodnott výsledky v posledních třech letech. Pro zpracování dat byla použta jednofaktorová a vícefaktorová analýza rozptylu a lneární regrese. Klíčová slova: NOV, lneární regrese, testování hypotéz. bstract The thess deals wth statstcal analyss of results of mathematcs entrance tests. These tests are used for comparson of the entrance knowledge of students from facultes of the Unversty of West Bohema n Plsen and have been performed annually snce 6. The am of the thess s to assess the nfluence of the test results on the partcular branch and analyze them n the last three years. For the analyss of the data were used the One-Way and Two-Way nalyss of Varance (NOV) and lnear regresson. Key words: NOV, lnear regresson, testng hypothess.

Obsah 1 Úvod... 1 Vstupní data....1 Vstupní testy z matematky.... Zpracování vstupních dat... 3 nalýza rozptylu (NOV)... 6 3.1 Jednoduché třídění (one-way NOV, jednofaktorová NOV)... 6 3. Mnohonásobné porovnávání (post-hoc analýza)... 9 3.3 Dvojné třídění (two-way NOV, dvoufaktorová NOV)... 9 4 Regresní analýza... 11 4.1 Jednoduchá regrese (přímka)... 11 5 Obory v rámc Fakulty aplkovaných věd... 13 5.1 Rok 1... 15 5. Rok 11... 16 5.3 Rok 1... 17 5.4 Všechny roky dohromady... 18 6 Obory v rámc Fakulty elektrotechncké... 6.1 Rok 1... 3 6. Rok 11... 5 6.3 Rok 1... 6 6.4 Všechny roky dohromady... 6 7 Obory všech fakult... 3 7.1 Rok 1... 3 7. Rok 11... 33 7.3 Rok 1... 34 7.4 Všechny roky dohromady... 35 8 Závěr a shrnutí výsledků... 38 9 Seznam lteratury... 4

1 Úvod Cílem předkládané bakalářské práce je statstcké zpracování dat získaných ze vstupních testů z matematky. Tyto testy se konají každoročně od roku 6, kdy byly poprvé uskutečněny na katedře matematky Fakulty aplkovaných věd Západočeské unverzty v Plzn. Účel testů je porovnat vstupní matematcké znalost studentů jednotlvých fakult. Tato práce je zaměřena na souvslost výsledku testu se studovaným oborem. Tedy zda má na výsledek vstupního testu z matematky vlv obor, který student studuje. V prác je dále sledován vývoj úspěšnost studentů v posledních třech letech. Ve druhé kaptole jsou popsána vstupní data použtá v bakalářské prác, formuláře vstupních testů a je ukázán pro příklad test z roku 1. Následuje pops zpracování vstupních dat a použtý software. Následující dvě kaptoly jsou věnovány teoretcké část. Ve třetí kaptole je pops hlavní metody, která byla v prác použta, a to metody NOV. Je zde uvedena jak jednofaktorová, tak dvoufaktorová analýza rozptylu. Tato kaptola dále obsahuje podkaptolu, která se věnuje problematce mnohonásobného porovnávání. Ve čtvrté kaptole se práce zabývá regresní analýzou. Je zde podrobněj popsána jednoduchá regrese, pomocí níž odhadujeme závslost výsledků vstupních testů na jednotlvých letech. Následující tř kaptoly předkládané práce obsahují výpočtovou část. Pátá kaptola se věnuje jednotlvým oborům Fakulty aplkovaných věd, šestá kaptola je zaměřena na obory Fakulty elektrotechncké a sedmá kaptola hodnotí obory všech fakult dohromady. V úvodu všech těchto kaptol jsou data upravena a poté jsou spočteny základní statstky. Každá z těchto kaptol je rozdělena do čtyř podkaptol. V první část jsou zpracována data z roku 1, ve druhé data z roku 11, ve třetí z roku 1 a v poslední čtvrté část jsou sledována data ze všech let dohromady. V každé podkaptole je zjšťováno, zda studovaný obor má vlv na výsledky testů, testuje se tedy nulová hypotéza o shodnost středních hodnot vybraných skupn. Pokud je prokázán statstcky významný rozdíl mez obory, zjšťuje se pomocí metody mnohonásobného porovnávání, které dvojce oborů se od sebe významně lší. Poslední podkaptola navíc obsahuje vývoj oborů v jednotlvých letech a sleduje závslost výsledků vstupních testů na jednotlvých letech. 1

Vstupní data V této kaptole jsou popsána vstupní data k bakalářské prác a jejch zpracování. Jedná se o výsledky vstupních testů z matematky studentů Západočeské unverzty (ZČU), které se pořádají na katedře matematky..1 Vstupní testy z matematky Vstupní testy z matematky se konají každoročně od roku 6, kdy byly poprvé uskutečněny na katedře matematky. Cílem je porovnat vstupní matematcké znalost studentů jednotlvých fakult. Tento test student vyplňují na prvním cvčení, přčemž na vypracování mají dvacet mnut. Jedná se o jednoduchý test, který osahuje deset otázek, týkajících se matematckých znalostí ze střední školy. Kromě jedné otázky obsahuje každá pět nabídnutých odpovědí, ze kterých je správně právě jedna odpověď. Opravu testů pak provádí jednotlví cvčící. Obrázek.1 a. obsahuje ukázku vstupního testu z roku 1. Formuláře pro vstupní testy z matematky se během tří let mírně změnly. V roce 1 student vyplňoval následující údaje: jméno a příjmení, fakulta, název střední školy, město a rok ukončení střední školy. V roce 11 a 1 měl navíc vyplnt typ střední školy a nformac, zda maturoval z matematky.. Zpracování vstupních dat Pro vypracování této bakalářské práce byly vedoucím práce poskytnuty výsledky vstupních testů ze školních let 1/11, 11/1 a 1/13. Pro doplnění nformací byly poskytnuty také ukázky vstupních testů ze stejných let. Data byla zpracována v softwaru MS Offce Excel. Jelkož se změnly formuláře, změnly se nformace, které byly obsaženy v datech. Data z roku 1 obsahovala nformace, kde se test psal, tedy o katedře, předmětu a kroužku, kde se test psal, semestru, kdy se test psal a jaký učtel test zadával. Dále nformace o studu studenta, na jaké fakultě studoval, v jakém městě, ročníku, forma jeho studa, program a konkrétní obor, který studoval. Dalším údajem byla střední škola studenta a kraj, kde se střední škola nachází. V letech 11 a 1 pak přbyly údaje o typu střední školy a nformace o maturtě. Ve všech letech bylo zaznamenáno pohlaví studenta a samozřejmě

Obrázek.1: Ukázka vstupního testu z matematky, 1, 1. část 3

Obrázek.: Ukázka vstupního testu z matematky, 1,. část 4

nformace o dosažených bodech ve vstupním testu. K dspozc byly jak celkové výsledky, tak body získané v jednotlvých příkladech. Malá ukázka dat je v tabulce.1, kde je v jednotlvých sloupcích uvedená fakulta, forma studa, kód studovaného programu a číslo oboru, celkový počet dosažených bodů a získané body v jednotlvých příkladech, dále pohlaví studenta, kraj, kde se nacházela jeho střední škola a typ střední školy. Formuláře vstupních testů z matematky však někteří student nevyplnl zcela kompletně. U některých byl dokonce známý pouze výsledek a fakulta, kterou studují. Pokud byl tedy pro výpočet potřebný některý z chybějících údajů, bylo nutné ho v případě možnost doplnt nebo studenta z dat vyloučt. Dále byl student rozdělen do skupn podle studované fakulty a konkrétního oboru. Všechny tyto úpravy byly provedeny v softwaru MS Offce, kde byly také vypočteny základní statstky vybraných podsouborů. Následné zpracování dat bylo provedeno v softwaru Statstca 1. Tento software umožňuje mportovat data z MS Offce Excel a obsahuje velké množství grafů, testů, analýz, metod, apod. Užvatelské prostředí je velm podobné jako u MS Offce. fak forma kod cslo body pr1 pr pr9 pr1 pohl kraj xtyp FV P B39 181R1 6 1 1 M Plzensky SOS FV P B39 181R1 5 1 1 1 M Plzensky G FV P B39 181R1 8 1 1 1 M Karlovarsky G FV P B39 181R1 4 1 1 1 1 M Jhocesky SOS FV P B39 181R1 3 1 M Plzensky SOS FV P B39 181R1 1 1 1 1 1 M Plzensky G FV P B39 181R1 9 1 1 1 1 M Karlovarsky G FV P B39 181R1 3 1 1 M Stredocesky SOS Tabulka.1: Ukázka dat ze vstupních testů z matematky 5

3 nalýza rozptylu (NOV) nalýza rozptylu (analyss of varance - NOV) umožňuje zjstt, zda má na závsle proměnnou statstcky významný vlv jeden č více faktorů. Tento faktor musí nabývat konečného počtu hodnot, tzv. úrovní, nejméně však dvou. Podle počtu faktorů používáme metodu NOV s jednoduchým č vícenásobným tříděním. nalýza rozptylu umožňuje porovnávat lbovolný počet skupn. Základní statstkou analýzy rozptylu je F-testovací statstka rozdílnost skupnových průměrů, pomocí níž se testuje hypotéza, zda se průměry ve skupnách od sebe lší více než na základě působení náhodného kolísání. Pokud se průměry statstcky významně nelší, usuzuje se, že faktor nemá vlv na závsle proměnnou. Jestlže je naopak vyhodnoceno, že faktor má statstcky významný vlv, řeší se pomocí metod mnohonásobného porovnávání otázka, které soubory se od sebe významně lší. Obecně má F-statstka v analýze rozptylu formu: vážený rozptyl mez průměry skupn. F = rozptyl mez jednc ve stejné skupně Pokud překročí hodnota F-statstky určenou krtckou mez, zamítá se nulová hypotéza, že mají všechny teoretcké průměry stejnou hodnotu. 3.1 Jednoduché třídění (one-way NOV, jednofaktorová NOV) V případě jednoduchého třídění je zkoumán vlv jednoho faktoru na závsle proměnnou. Počet hodnot, tzv. úrovní, faktoru je označen I a předpokládá se, že I. Pro -tou úroveň faktoru je realzováno n nezávslých pozorování 1, y yn ( 1,..., I) y,...,, o kterých se předpokládá, že jsou náhodným výběrem z rozdělení N, jsou navzájem nezávslé. Pozorování se zapíše ve tvaru kde p e jsou náhodné odchylky, ~ N, y p p, výběry nechť e ( p 1,..., n; 1,..., I ), (3.1) e p. Testovaná hypotéza má tvar H : 1... I. 6

Celkový počet měření je značen n, n n1 n ni, a je vážený průměr hodnot, Hypotéza H je ekvvalentní rovnostem od celkového průměru, Poté lze uvažovaný model psát ve tvaru a hypotéza H je ekvvalentní hypotéze y p I n. n 1 pro 1,..., I. Dále označme odchylky ( 1,..., I). e ( p 1,..., n; 1,..., I ) (3.) H p H ve tvaru ( ) ( ) : 1 I Protože v modelech 3.1 a 3. jsou, konstantní parametry, říká se, že jsou to modely s pevným efekty. Označme y dílčí výběrové průměry,. n buď celkový počet pozorování, a y buď celkový průměr, y 1 n n p1 y p n n1 n ( 1,..., I), n I 1 y n I n 1 p1 y p. Defnujme součty S T I n 1 p1 ( y y), p S I 1 ( y y) n, S e I n 1 p1 ( y y ). p Součet S T vyjadřuje celkovou varabltu pozorování. Součet S vyjadřuje tzv. mezskupnovou varabltu, tedy varabltu vysvětlovanou působením faktoru a součet S e vyjadřuje tzv. vntroskupnovou varabltu, tedy varabltu vysvětlovanou působením náhodných odchylek. 7

Za platnost hypotézy H mají velčny S T /, S / a S e / rozdělení pravděpodobnost s počty stupňů volnost, které označíme f T, f T n 1, f I 1, n I. f e f, f e a platí Platí f T f f. e Podíly S / f a S e / f e jsou nazývány průměrné čtverce, jejch podíl označme F, F S S. e / / f f e Pokud platí hypotéza H, pak má velčna F rozdělení pravděpodobnost F s počty stupňů volnost f, f e. Je-l hodnota F vysoká, pak je mezskupnová varablta ve srovnání s vntroskupnovou varabltou velká a hypotézu H (resp. H ) můžeme zamítnout. ( ) Hypotéza H se zamítá na hladně významnost, pokud statstka 1(1 ) %-ní kvantl rozdělení F s počty stupňů volnost f, e F převýší f, tj. je-l F F f, f. 1 e Zdroj varablty faktor Součet Počet stupňů Průměrný F čtverců (SS) volnost (df) čtverec (MS) S I 1 f f S / F rezduální S e f e n I S e / f e - celkem S f T n 1 - - T Tabulka 3.1: Tabulka analýzy rozptylu jednoduchého třídění Př použtí metody NOV ve statstckém softwaru se ve výsledcích udává tzv. p- hodnota příslušné statstky. Platí, že hypotézu lze zamítnout na hladně významnost, právě když p-hodnota příslušné testové statstky je menší nebo rovna. Jestlže dosáhla statstka F nadkrtcké hodnoty a došlo k zamítnutí hypotézy H na hladně významnost, zajímá nás obvykle, které skupny (výběry) se od sebe lší, tj. pro které dvojce, j platí porovnávání. (, j 1,..., I). K tomu slouží metody mnohonásobného j 8

3. Mnohonásobné porovnávání (post-hoc analýza) Je-l zamítnuta nulová hypotéza o shodě všech středních hodnot ve výběrech, znamená to, že působí faktor na měřenou velčnu významně. V tom případě nás obvykle zajímá, která dvojce středních hodnot se od sebe lší. Jedna z možností je porovnat každou dvojc průměrů nebo dvojce, které nás zajímají. Vícenásobné testování významnost však vede k tomu, že může dojít k vysoké pravděpodobnost, že bude nalezen významný rozdíl pouze náhodou. Chyba prvního druhu by byla podstatně vyšší než zvolená hladna významnost. Pro mnohonásobné porovnávání exstuje několk metod, například Bonferronho, Tukeyova, Newman-Keulsova, Duncanova, Fsherovo LSD (nejmenší významný rozdíl - Least Sgnfcant Dfference) a Scheffého. Mez nejúčnnější patří Tukeyova metoda. Úkolem každé metody je udržet danou hladnu pravděpodobnost chyby prvního druhu (5 %) a v podstatě j rozdělt mez všechna porovnání. Některé z těchto testů jsou velm konzervatvní. Může se stát, že F test zamítne hypotézu o rovnost průměrů, a přtom žádná dvojce průměrů se od sebe podle výsledků metod mnohonásobného porovnávání navzájem významně nelší. 3.3 Dvojné třídění (two-way NOV, dvoufaktorová NOV) model Př dvojném třídění je sledován vlv dvou faktorů, které označíme, B. Je uvažován y jp e ( p 1,..., nj ; 1,..., I; j 1,..., J ), (3.3) j kde I je počet úrovní faktoru, J je počet úrovní faktoru B, jp jp y p 1,..., n ) jsou pozorování ve třídě, která je kombnací -té úrovně faktoru a j-té ( j úrovně faktoru B a n j je počet pozorování pro tuto kombnac, je nějaká neznámá konstanta, je pevný efekt -té úrovně faktoru, j je pevný efekt j-té úrovně faktoru B, e jp ~ N, jsou nezávslé náhodné odchylky, rozptyl neznáme. V modelu 3.3 se účnky (efekty) faktorů, B navzájem kombnují jednoduchým způsobem, sčítají se. Tento model se nazývá model bez nterakcí. Velkost efektů nemůže být určena jednoznačně pouze vztahem 3.3; zvětšíme-l např. všechny o nějakou hodnotu 9

a zmenšíme o, zůstanou rovnost 3.3 zachovány. Proto se na efekty j a podobně na kladou doplňující požadavky,, které se nazývají reparametrzační j podmínky. V případě nestejných počtů pozorování v podtřídách n j může být řešení úloh poměrně obtížné. Proto bývají testové statstky odvozovány př stejných n j. Př dvojném třídění se podobně jako u jednoduchého třídění opět defnuje součet varabltu pozorování, dále součty S a varabltu působením faktoru a B a dále součet S T, který vyjadřuje celkovou S B, které vyjadřují mezskupnovou varabltu, tedy S e, který vyjadřuje vntroskupnovou varabltu, tedy varabltu vysvětlovanou působením náhodných odchylek. Následně je vypočtena velčna F a F B a dojde k testování hypotéz. Hypotézu H... zamítáme na hladně významnost, je-l F F f, f. 1 : 1 I e B Hypotézu H... zamítáme na hladně významnost, je-l F F f, f. B 1 B : 1 J e Více nformací lze najít v [1] a []. 1

4 Regresní analýza V regresní analýze se odhaduje, jakým způsobem závsí hodnoty č střední hodnoty nějaké náhodné velčny, nazývající se vysvětlovaná proměnná, na jné nebo na několka jných velčnách, které se nazývají vysvětlující proměnné. 4.1 Jednoduchá regrese (přímka) Jde o případ, kdy závslost mez vysvětlující proměnnou x a vysvětlovanou proměnnou y lze popsat rovncí přímky y 1 x. Máme n dvojc ( x, y ), kde n, x jsou hodnoty vysvětlující proměnné, z nchž alespoň dvě jsou navzájem různé a y jsou hodnoty vysvětlované proměnné. Předpokládejme, že platí: y 1x ( 1,,..., n), kde, 1 jsou neznámé parametry, jejchž hodnoty chceme odhadnout. jsou neznámé náhodné odchylky, u kterých předpokládáme, že jejch střední hodnota je nulová, rozptyl všech těchto náhodných odchylek je stejný a jsou nezávslé velčny. Koefcenty, 1 se odhadují zpravdla metodou nejmenších čtverců (MNČ). Tyto odhady značíme b, b 1. Název MNČ je odvozen z faktu, že b, b 1 mnmalzují součet druhých mocnn S n 1 ( b b1 x y ). Položíme-l parcální dervace S podle b, b 1 rovny (nutná podmínka mnma), získáme rovnce, které tvoří tzv. soustavu normálních rovnc pro hledané odhady b, b 1. Řešení této soustavy je: Přímka x y n x y x n b 1, b y b x 1. x b b x se nazývá regresní přímka. Odhady b, b 1 získané MNČ jsou y 1 nestranným odhady koefcentů, 1 a mají-l odchylky normální rozdělení, mají b, b 1 ze všech nestranných odhadů koefcentů, 1 nejmenší rozptyl. Defnujeme tzv. vyrovnané (nebol očekávané) hodnoty ŷ vztahem ˆ ( 1,,..., n). y b b1 x 11

Rozdíly mez naměřeným a vyrovnaným hodnotam se značí e a nazývají se rezdua: e y yˆ ( 1,,..., n). Součet druhých mocnn rezduí se nazývá rezduální součet čtverců a značí se RSS. Statstka RSS s R n e. 1 RSS n je nestranným odhadem parametru D( ) a nazývá se rezduální rozptyl. Odhady b, b 1 koefcentů, 1 jsou náhodné velčny s rozptyly k k ( x x) n n 1 1 1 x D( b ) n n n ( x), 1 ( x x) v, kde n Protože parametr D ˆ ( b 1 nebývá znám, dosadíme odhad D( b1 ). n ( x) n n v ( 1,..., k). n s a získané odhady označíme D ˆ ( ), ). Příslušné odhady směrodatných odchylek se ve statstckých programech zpravdla označují SE, tj. SE b ) Dˆ ( ), SE b ) Dˆ ( ). ( b R ( 1 b1 Předpokládejme, že náhodné odchylky mají normální rozdělení. Pak statstky t, t 1 defnované předpsy t b, SE b ) mají rozdělení pravděpodobnost t ( n ). ( t 1 b1 1 SE( b 1 ) Tyto statstky jsou většnou uváděny v programech pro a a můžou se 1 b použít k testu hypotézy nebo. Nejčastěj nás zajímá, zda je (proměnná 1 x nemá vlv na y) nebo (x ovlvňuje y). Hypotézu zamítneme na hladně 1 1 1 významnost př oboustranné alternatvě 1, pokud pro uvedenou statstku t po 1 dosazení 1 platí t t ( n ) 1. Je-l zamítnuta hypotéza 1 na hladně 1 významnost,5, říkáme, že se koefcent b 1 významně lší od nuly, resp. stručněj, že je významný. 1

5 Obory v rámc Fakulty aplkovaných věd V této kaptole jsou shrnuty výsledky testování, zda studovaný obor na Fakultě aplkovaných věd (FV) statstcky významně ovlvňuje výsledek vstupního testu z matematky. Výpočty byly provedeny v softwaru Statstca. Data, zahrnující výsledky studentů FV z roku 1, 11 a 1, byla nejdříve upravena. Ze souborů byl odstraněn student druhých a vyšších ročníků a zároveň student kombnované formy studa. Student byl rozdělen dle jednotlvých oborů, jak je zobrazeno v tabulce 5.1. Jelkož je na FV velké množství oborů, byl student posléze rozčleněn pro lepší přehlednost podle programů. Pro jednotlvé skupny pak byly vypočteny základní statstky, vz tabulka 5.. Celkem Zkratka Obor Název oboru Počet studentů 1 11 1 Matematka MT 111R3 Obecná matematka 9 6 6 Matematka MT 111R48 Matematka pro přírodní vědy 6 3 Matematka MT 111R49 Matematka a fnanční studa 1 1 13 Matematka MT 111R5 Matematcké výpočty a modelování 4 5 1 Matematka MT 111R51 Matematka a management 1 7 Geomatka GEOM 3647R Geomatka 16 17 16 Inženýrská nformatka INF 181R1 Informatka 18 146 118 Inženýrská nformatka INF 181R18 Informační systémy 9 37 48 Inženýrská nformatka INF 61R51 Výpočetní technka 1 8 Inženýrská nformatka INF Inženýrská nformatka INF Inženýrská nformatka INF 39R53 39R54 39R55 Intelgentní komunkace člověk - stroj Počítačové řízení strojů a procesů Systémy pro dentfkac, bezpečnost a komunkac 7 5 3 4 5 5 6 4 Stavební nženýrství STV 367R5 Stavtelství 5 65 55 Stavební nženýrství STV 3914R Územní plánování 1 5 1 plkované vědy a nformatka plkované vědy a nformatka plkované vědy a nformatka plkované vědy a nformatka Počítačové modelování v technce Počítačové modelování v technce VI 391R3 Mechanka 4 VI 391R3 plkovaná a nženýrská fyzka 5 5 4 VI 39R6 Kybernetka a řídící technka 8 4 4 VI 67R4 Fnanční nformatka a statstka 15 8 6 PMT 39R49 Počítačové modelování 1 7 5 PMT 39R51 Výpočty a desgn 9 17 6 Celkem 366 386 33 Tabulka 5.1: Rozdělení studentů FV 13

Počet studentů Průměr Rozptyl Program 1 11 1 1 11 1 1 11 1 VI 5 37 34 6,37 6,43 6,441 4,59 7,157 4,48 GEOM 16 17 16 6,688 6,76 5,438 4,34 5,5 4,871 INF 174 7 184 5,63 5,4 5,34 5,95 5,198 4,53 MT 41 31 6,756 7,65 6,77 4,965 4,576 7,56 PMT 1 4 11 6,86 5,54 6,455 4,99 6,8 6,43 STV 6 7 65 4,4 4,914 4,831 3,7,964 3,55 Celkem 366 386 33 - - Tabulka 5.: Základní statstky FV Na obrázku 5.1 je zobrazen graf, kde je přehled průměrných výsledků jednotlvých fakult, rozdělený podle let. Obrázek 5.1: Srovnání programů FV Nejlepšího výsledku dosáhly obory v rámc programu Matematka v roce 11. Naopak nejhorších výsledků dosahoval student z programu Stavební nženýrství, kteří měl nejnžší průměr v roce 1. Jak lze vdět z grafu, výsledky v jednotlvých letech byly podobné, kromě programu Geomatka, kde se výrazně lšly výsledky z roku 1 oprot ostatním a programu Počítačové modelování v technce, kde byl odlšný rok 11. 14

Dále jsme za použtí softwaru Statstca provedl zpracování dat metodou NOV a lneární regrese. Testy byly provedeny na hladně významnost, 5. 5.1 Rok 1 V této část jsou zpracována data FV pro rok 1. Obrázek 5. zobrazuje přehled jednotlvých programů. Na obrázku 5.3 je ukázka výsledné tabulky testu NOV. P-hodnota vyšla velm nízká, zamítáme tedy nulovou hypotézu o shodnost středních hodnot. Studovaný program je statstcky významným faktorem. V grafu lze pozorovat, že výsledky jednotlvých programů jsou relatvně vyrovnané, výrazně vybočuje pouze program Stavební nženýrství. Obrázek 5.: Srovnání programů FV 1 Obrázek 5.3: Ukázka výsledné tabulky NOV Jelkož došlo k zamítnutí nulové hypotézy o shodnost středních hodnot jednotlvých programů, bylo zjšťováno, které dvojce středních hodnot se od sebe významně lší. K tomu slouží tzv. mnohonásobné porovnávání. Byla použta Tukeyova metoda pro nestejné počty pozorování ve skupnách. Na obrázku 5.4 je ukázka výsledné tabulky této metody. 15

Obrázek 5.4: Ukázka výsledné tabulky mnohonásobného porovnávání Výsledky tohoto testu potvrzují, že se skutečně program Stavební nženýrství významně lšl od výsledků ostatních programů, což bylo patrné jž z grafu na obrázku 5.. U ostatních programů nebyl v roce 1 zaznamenán významnější rozdíl mez jejch středním hodnotam. 5. Rok 11 V této část jsou pro výpočty použty výsledky studentů FV z roku 11. Na obrázku 5.5 je přehled jednotlvých programů. Nejlépe s vedl student programu Matematka, nejhůře student Stavebního nženýrství. Obrázek 5.5: Srovnání programů FV 11 Opět byla použta jednofaktorová metoda NOV, přčemž p-hodnota testu byla,14, proto došlo k zamítnutí nulové hypotézy o shodnost středních hodnot. Studovaný obor je v roce 11 statstcky významným faktorem. 16

Pomocí metody mnohonásobného porovnávání byl určen rozdíl mez programem Matematka a Stavební nženýrství, tedy mez programem s nejlepším a nejhorším výsledkem. Další významný rozdíl byl zaznamenán mez programy Matematka a Inženýrská nformatka. Ostatní programy jž nebyly od programu Matematka an mez sebou vzdáleny významně. 5.3 Rok 1 Na obrázku 5.6 je uveden graf pro jednotlvé programy FV v roce 1. Stejně jako v mnulých letech dosahoval v tomto roce nejlepších výsledků student programu Matematka, nejhorších pak student Stavebního nženýrství. Obrázek 5.6: Srovnání programů FV 1 P-hodnota jednofaktorové metody NOV byla,494, dojde tedy k zamítnutí nulové hypotézy o shodnost středních hodnot jednotlvých programů. I pro tento rok je studovaný program statstcky významným faktorem. Mnohonásobným porovnáváním byl zjštěn statstcky významný rozdíl mez Stavebním nženýrstvím a Matematkou, dále Stavebním nženýrstvím a programem plkované vědy a nformatka. Dle grafu bychom se mohl domnívat, že bude statstcky významný rozdíl mez programy Stavební nženýrství a Počítačové modelování v technce, protože tento program dosáhl podobných výsledků jako program plkované vědy a nformatka. Tento rozdíl však pomocí mnohonásobného porovnávání nebyl prokázán, což může být způsobeno 17

tím, že má program Počítačové modelování v technce větší nterval spolehlvost než program plkované vědy a nformatka. 5.4 Všechny roky dohromady V této podkaptole jsou zkoumány jak výsledky programů FV pro všechny roky dohromady, tak průběh výsledků v posledních třech letech. Přehled výsledků jednotlvých programů ve všech letech dohromady je zobrazen na obrázku 5.7. Programem s nejlepším výsledky byl program Matematka, což se dalo vzhledem k zaměření studentů předpokládat. Tento program dosáhl nejlepších výsledků nejen v souhrnu, ale v jednotlvých letech. Naopak nejhorších výsledků jak v souhrnu, tak v jednotlvých letech dosáhl program Stavební nženýrství. Obrázek 5.7: Srovnání programů FV 1-1 Jelkož ve všech jednotlvých letech byl studovaný program statstcky významným faktorem, mohl bychom se domnívat, že v celkových výsledcích dojde k zamítnutí nulové hypotézy o shodnost středních hodnot jednotlvých souborů. Tento předpoklad byl ověřen pomocí metody NOV, mez zkoumaným programy byl potvrzen statstcky významný rozdíl. Pro zjštění dvojc, u kterých je rozdíl významný, bylo použto mnohonásobné porovnávání. Významně se lšl program Stavební nženýrství a to od všech ostatních 18

programů, což je patrné z grafu na obrázku 5.7. Program Stavební nženýrství měl ve výsledcích o necelý bod nžší průměr než druhý bodově nejslabší program Inženýrská nformatka. Dále byl zaznamenán rozdíl mez Inženýrskou nformatkou a plkovaným vědam a mez Inženýrskou nformatkou a Matematkou. V dalším kroku bylo sledováno, zda rok také statstcky významně ovlvňuje výsledky vstupních testů z matematky. Pro zhodnocení významu byla použtá dvourozměrná metoda NOV bez nterakce a to pro faktory program a rok. Na hladně významnost bylo prokázáno, že program je statstcky významným faktorem, ale rok je statstcky nevýznamným faktorem. Ukázka výsledné tabulky je na obrázku 5.8. Na obrázku 5.9 je pro doplnění zobrazeno srovnání výsledků v jednotlvých letech. Obrázek 5.8: Ukázka výsledné tabulky NOV Obrázek 5.9: Srovnání výsledků FV v jednotlvých letech Následně byl sledován vývoj výsledků v jednotlvých letech pro každý program samostatně. Celkový přehled programů je na obrázku 5.1. Z tohoto grafu je zřejmé, že nejlepších výsledků dosahovaly obory programu Matematka, nejhorších výsledků pak dosahoval program Stavební nženýrství. Program Geomatka měl v roce 1 výrazně nžší průměr než v ostatních letech. Pro úplnost je ještě doplněn obrázek 5.11, kde jsou grafy pro jednotlvé obory oddělené. 19

Obrázek 5.1: Vývoj programů FV v jednotlvých letech Obrázek 5.11: Vývoj programů FV v jednotlvých letech

Pomocí jednoduché regrese byl vyhodnocen vývoj jednotlvých programů během sledovaných let. Byl uvažován model y b b1 x, více v kaptole 4. V tabulce 5.3 je přehled odhadů koefcentů jednoduché regrese pro jednotlvé programy FV a souhrn pro všechny programy FV. Program b b 1 P-hodnota VI -9,15,48,849146 GEOM 163,161 -,65,18581 INF 91,74 -,14,7979 MT -3,94,,94881 PMT 7,55 -,33,9436 STV -581,,91,78769 Celkem 6,8 -,11,3957 Tabulka 5.3: Jednoduchá regrese FV Na hladně významnost, 5 se an v jednom případě nepodařlo prokázat závslost výsledků vstupních testů z matematky na roce, kdy byl test vyplňován. však u programu Stavební nženýrství vyšla p-hodnota poměrně nízká, př zavedení hladny významnost např.,1 by jž došlo k prokázání závslost výsledku testu na jednotlvých letech. 1

6 Obory v rámc Fakulty elektrotechncké V této část jsou sledovány výsledky vstupních testů z matematky studentů Fakulty elektrotechncké (FEL). Byl zjšťován vlv studovaného oboru FEL na výsledek testu. Před zpracováním dat v softwaru Statstca musela být data nejdříve upravena. Z jednotlvých souborů byl vyřazen student kombnované formy studa a student druhých a vyšších ročníků. Poté byl student rozdělen dle jednotlvých oborů. Přehled oborů FEL, které se testování zúčastnly, je v tabulce 6.1. Obor Název oboru Zkratka 6R1 plkovaná elektrotechnka EL 6R7 Elektrotechnka a energetka ELE 6R1 Komerční elektrotechnka KOE 61R19 Elektronka a telekomunkace ET 394R15 Techncká ekologe TEK Tabulka 6.1: Obory FEL V následující tabulce 6. jsou uvedeny základní statstky jednotlvých oborů. Obor Počet studentů Průměr Rozptyl 1 11 1 1 11 1 1 11 1 EL 45 35 45 4,8 4,86 5,844 3,48,718 3, ELE 79 9 96 5,316 4,933 5,5 3,558 3,64 4,36 KOE 164 9 114 4,51 4,75 4,456 3,41 3,95 3,985 ET 86 85 67 5,81 4,635 5, 3,749 3,596 4,119 TEK 7 48 49 3,9 4,64 4,551,861 3,81 4,39 Celkem 444 35 371 - - Tabulka 6.: Základní statstky FEL Nejvíce zúčastněných studentů FEL bylo v roce 1. Nejlepšího průměrného výsledku dosáhl obor plkovaná elektrotechnka v roce 1, nejhoršího naopak obor Techncká ekologe v roce 1. Grafcké srovnání oborů v jednotlvých letech je znázorněno na obrázku 6.1. Jak lze vdět z grafu, výsledky jsou v jednotlvých letech různé. Není proto možné dle tohoto srovnání stanovt obor, který by měl výrazně horší č lepší výsledky během sledovaného období.

Obrázek 6.1: Srovnání oborů FEL Následovalo další zpracování dat v softwaru Statstca. Nejdříve byla provedena analýza oborů metodou NOV pro jednotlvé roky odděleně, poté analýza pro všechny roky dohromady. Všechny testy byly provedeny na hladně významnost, 5. 6.1 Rok 1 Student Fakulty elektrotechncké, kteří se zúčastnl testování v roce 1, byl rozdělen do skupn dle jednotlvých oborů. Na obrázku 6. je zobrazen přehled jednotlvých oborů FEL v roce 1. Nejlepších výsledků dosáhl obor Elektrotechnka a energetka, naopak nejhorších obor Techncká ekologe. Průměr těchto oborů se od sebe lšl téměř o jeden a půl bodu. Rozdíl mez jednotlvým obory byl testován metodou NOV v softwaru Statstca. 3

Obrázek 6.: Srovnání oborů FEL 1 Na obrázku 6.3 je ukázka výsledné tabulky metody NOV. P-hodnota byla,7, zamítáme tedy nulovou hypotézu o shodnost středních hodnot ve všech skupnách. Mez obory je statstcky významný rozdíl. Obrázek 6.3: Ukázka výsledné tabulky NOV Pomocí metody mnohonásobného porovnávání byly určeny dvojce oborů, které se mez sebou významně lší. Na obrázku 6.4 je uvedena výsledná tabulka mnohonásobného porovnávání, kde jsou vyznačeny dvojce rozdílných oborů červenou barvou. Obrázek 6.4: Ukázka výsledné tabulky mnohonásobného porovnávání 4

Dle použtého testu je zřejmé, že se významně lší obor Techncká ekologe od oboru Elektronka a telekomunkace a zároveň od oboru Elektrotechnka a energetka. Obor Techncká ekologe dosáhl ve zmíněném roce nejnžších výsledků, naopak nejlepší výsledky měl obor Elektronka a telekomunkace, druhé nejlepší pak obor Elektrotechnka a energetka. Obor s nejnžším průměrem se tedy od prvních dvou nejvyšších průměrů lšl významně. Rozdíl oboru Elektrotechnka a energetka a oboru Komerční elektrotechnka nebyl na hladně významnost, 5 prokázán, ale p-hodnota byla,51755. Př zavedení hladny významnost například, 1 by jž byl mez těmto obory prokázán významný rozdíl. Mez ostatním obory jž rozdíl v průměrech nebyl tak významný. 6. Rok 11 V tomto případě jsou použty výsledky studentů FEL v roce 11. Na obrázku 6.5 je přehled jednotlvých oborů FEL. Nejlepších výsledků opět dosahoval student oboru Elektrotechnka a energetka, nejhorších tentokrát student oboru plkovaná elektrotechnka. Obrázek 6.5: Srovnání oborů FEL 11 P-hodnota NOV testu se rovnala,599, přjímáme nulovou hypotézu o shodnost středních hodnot jednotlvých skupn. V roce 11 se tedy neprokázal významný rozdíl mez jednotlvým obory. Výsledky testu potvrdly graf na obrázku 6.5, průměry jednotlvých oborů jsou poměrně vyrovnané, maxmální rozdíl mez dvěma obory je přblžně,6 bodu. 5

6.3 Rok 1 Grafcké srovnání oborů Fakulty elektrotechncké v roce 1 lze vdět na obrázku 6.6. Nejlepšího průměru dosáhl obor plkovaná elektrotechnka. P-hodnota jednofaktorové metody NOV byla v tomto roce,1846, dojde tedy k zamítnutí nulové hypotézy o shodnost středních hodnot jednotlvých oborů. Mnmálně dvě střední hodnoty se od sebe statstcky významně lší. Obrázek 6.6: Srovnání oborů FEL 1 Mnohonásobným porovnáváním byl zjštěn významný rozdíl mez obory plkovaná elektrotechnka a Komerční elektrotechnka, kde byl rozdíl mez průměry přblžně 1,4 bodu. Další významný rozdíl byl zaznamenán mez oborem plkovaná elektrotechnka a Techncká ekologe, mez kterým byl rozdíl přblžně 1,3 bodu. Ostatní dvojce oborů se jž od sebe nelšly tak významně. 6.4 Všechny roky dohromady V této část byly sledovány jak výsledky jednotlvých oborů Fakulty elektrotechncké pro všechny roky dohromady, tak závslost výsledků jednotlvých oborů na letech. Srovnání celkových výsledků oborů za všechny roky dohromady je zobrazeno v grafu na obrázku 6.7. Nejlepších výsledků pro všechny roky dosáhl obor Elektrotechnka a energetka, nejhorších naopak obor Techncká ekologe. 6

Obrázek 6.7: Srovnání oborů FEL 1-1 P-hodnota jednofaktorového NOV testu př sledovaném faktoru obor byla,47, proto byla zamítnuta nulová hypotéza o shodnost středních hodnot. Pro zjštění rozdílných dvojc oborů bylo použto mnohonásobné porovnávání. Byl prokázán významný rozdíl mez čtyřm dvojcem. Významně se lšl obor Elektrotechnka a energetka, který měl celkově nejlepší průměr mez obory Fakulty elektrotechncké, od oboru Komerční elektrotechnka. Nejhoršího průměru naopak dosáhl obor Techncká ekologe, který se významně lšl od všech oborů kromě oboru s druhým nejnžším průměrem. Lšl se tedy od oborů plkovaná elektrotechnka, Elektronka a komunkace a Elektrotechnka a energetka. Pro ověření, zda má na výsledky vstupních testů vlv také rok, ve kterém byly testy provedeny, byla použta dvourozměrná metoda NOV, kde k faktoru obor přbyl také faktor rok. Jak je vdět na obrázku 6.8, nebyl prokázaný vlv let na výsledky testování. Obrázek 6.9 obsahuje porovnání výsledků v jednotlvých letech, kde je patrné, že se výsledky přílš nelšly. Obrázek 6.8: Ukázka výsledné tabulky NOV 7

Obrázek 6.9: Srovnání výsledků FEL v jednotlvých letech Následně byl sledován vývoj výsledků v jednotlvých letech pro každý obor samostatně. Celkový přehled oborů je na obrázku 6.1. Pro úplnost je doplněn obrázek 6.11, kde jsou grafy pro jednotlvé obory oddělené. Obrázek 6.1: Vývoj oborů FEL v jednotlvých letech 8

Obrázek 6.11: Vývoj oborů FEL v jednotlvých letech Pomocí jednoduché regrese byl vyhodnocen vývoj jednotlvých oborů během sledovaných let. Byl uvažován model y b b1 x, více v kaptole 4. V tabulce 6.3 je přehled odhadů koefcentů jednoduché regrese pro jednotlvé obory FEL a souhrn pro všechny obory. Obor b b 1 P-hodnota EL -1,84,511,9395 ET 13,58 -,59,71985 ELE 54,17 -,14,41186 KOE 36,41 -,16,89865 TEK -689,765,345,4776 Celkem -18,97,9,18383 Tabulka 6.3: Jednoduchá regrese FEL Na hladně významnost, 5 se u oboru plkovaná elektrotechnka a Techncká ekologe podařlo prokázat závslost výsledků vstupních testů z matematky na roce, kdy byl test vyplňován. V obou případech vyšel koefcent b 1 kladný. U dalších oborů nebyla prokázána závslost výsledků testů na roce, kdy proběhlo testování vstupních znalostí studentů. 9

7 Obory všech fakult V této část práce jsou sledovány výsledky studentů ze všech oborů. Nejdříve za všechny roky zvlášť a poté dohromady. V letech 1, 11 a 1 se vstupních testů zúčastnly následující fakulty: Fakulta aplkovaných věd (FV), Fakulta ekonomcká (FEK), Fakulta elektrotechncká (FEL), Fakulta pedagogcká (FPE), Fakulta strojní (FST), Fakulta zdravotních studí (FZS), Ústav umění a desgnu (UUD), Fakulta flozofcká (FF) a Přírodovědecká fakulta (PrF). Z dat však byly odstraněny výsledky studentů PrF a FF, protože chyběly údaje o oborech testovaných studentů. Dále byl vyřazen student kombnované formy studa a student druhých a vyšších ročníků. Jelkož testovaných oborů bylo celkem čtyřcet, byly pro lepší přehlednost některé sloučeny. U Fakulty aplkovaných věd bylo oborů nejvíce, celkem, proto byl student rozdělen dle programů. Dále proběhlo sloučení dvou oborů u Fakulty ekonomcké. Obory přírodovědných studí na Fakultě pedagogcké měly malý počet testovaných studentů, proto u nch také došlo k sloučení do jedné skupny. V tabulce 7.1 je zobrazeno rozdělení studentů do jednotlvých skupn včetně počtu studentů a průměrů. Fakulta Obor Zkratka Počet studentů Průměr 1 11 1 1 11 1 Matematka MT 41 31 6,756 7,65 6,77 Geomatka GEOM 16 17 16 6,688 6,76 5,438 FV Stavební nženýrství STV 6 7 65 4,4 4,914 4,831 Inženýrská nformatka INF 174 7 184 5,63 5,4 5,34 FEK plkované vědy a nformatka Počítačové modelování v technce Management obchodních čnností Podnková ekonomka a management Systémové nženýrství a nformatka VI 5 37 34 6,37 6,43 6,441 PMT 1 4 11 6,86 5,54 6,455 MOČ 187 7 18 4,17 3,464 3,797 PEM 93 36 69 4,76 3,898 4,89 SI 1 78 113 4,48 3,93 4,195 FEL Elektrotechnka a energetka ELE 79 9 96 5,316 4,933 5,5 Komerční elektrotechnka KOE 164 9 114 4,51 4,75 4,456 3

Elektronka a telekomunkace ET 86 85 67 5,81 4,635 5, Techncká ekologe TEK 7 48 49 3,9 4,64 4,551 plkovaná elektrotechnka EL 45 35 45 4,8 4,86 5,844 FPE Přírodovědná studa PS 146 113 91 4,34 4,9 4,879 FST Strojní nženýrství STI 1 85 15 4,83 4,81 4,98 Strojírenství STR 96 86 74 3,691 4,67 4,189 FZS Radologcký asstent R 5 3 9,44 3, 3,448 UUD Desgn DE 1 7 8 4,333 5,143 3,75 Celkem 169 1697 1565 - Tabulka 7.1: Rozdělení studentů Na obrázku 7. je srovnání jednotlvých oborů ve třech sledovaných letech. Obrázek 7.1: Srovnání jednotlvých oborů 31

Nejlepšího výsledku dosáhl obor Matematka Fakulty aplkovaných věd v roce 11, naopak nejhoršího obor Radologcký asstent v roce 1. Jak je dle grafu vdět, bodové výsledky jsou v jednotlvých letech podobné. Větší rozdíl mez sledovaným roky je zachycen u oboru plkovaná elektrotechnka v roce 1 a především u oboru Geomatka, kdy byly výrazněj nžší výsledky z roku 1 oprot rokům 1 a 11. 7.1 Rok 1 V této část byly zkoumány výsledky studentů ze všech oborů v roce 1. Je testována nulová hypotéza o shodnost středních hodnot jednotlvých oborů. Zajímá nás tedy, zda je obor statstcky významným faktorem a má vlv na výsledky vstupních testů. Na obrázku 7. je srovnání studentů jednotlvých oborů v roce 1. Mez nejlepší obory patřly Matematka a Geomatka, mez nejhorší patřl obor Radologcký asstent. Obrázek 7.: Srovnání oborů 1 Výsledky testů byly dále zpracovány metodou NOV, jejíž výsledná tabulka je znázorněna na obrázku 7.3. Jak můžeme vdět, p-hodnota je blízká nule, proto na hladně významnost zamítáme nulovou hypotézu o shodnost středních hodnot. Studovaný obor je statstcky významným faktorem. 3

Obrázek 7.3: Ukázka výsledné tabulky NOV Pro zjštění dvojc, mez kterým je významný rozdíl, byla použta metoda mnohonásobného porovnávání. Například zaměříme-l se na obor s nejlepším výsledkem, tedy obor Matematka, významný rozdíl nebyl zaznamenán pouze s obory plkované vědy a nformatka, Desgn, Elektrotechnka a energetka, Geomatka, Inženýrská nformatka, Počítačové modelování v technce, tedy většnou s obory Fakulty aplkovaných věd. Nejhorších výsledků dosáhl obor Radologcký asstent, u toho nebyl zaznamenán významný rozdíl s obory Desgn, Management obchodních čnností, Podnková ekonomka a management, Přírodovědná studa. 7. Rok 11 Obrázek 7.4 zobrazuje přehled jednotlvých oborů v roce 11. Nejlepších výsledků opět dosáhly obory Matematka a Geomatka, nejhorších Radologcký asstent. Obrázek 7.4: Srovnání oborů 11 33

Dále byla provedena jednofaktorová NOV za použtí softwaru Statstca. P-hodnota byla blízká nule, nulová hypotéza o shodnost středních hodnot byla tedy zamítnuta. Mez obory je statstcky významný rozdíl ve výsledcích vstupních testů. Pro určení, které dvojce oborů se mez sebou významně lší, byla použta metoda mnohonásobného porovnávání. Opět se mez sebou přílš nelšly obory Fakulty aplkovaných věd. Významný rozdíl mez obory této fakulty byl pouze u dvojc Matematka a Inženýrská nformatka, Matematka a Stavební nženýrství. Jedný obor ze všech fakult, u kterého nebyl prokázán významný rozdíl s dalším oborem, byl obor Desgn. Tento obor má také největší nterval spolehlvost. 7.3 Rok 1 Srovnání jednotlvých oborů v roce 1 je na obrázku 7.5. Jako v předchozích letech měl nejlepší výsledky obor Matematka, naopak nejhorší obor Radologcký asstent. Obrázek 7.5: Srovnání oborů 1 P-hodnota NOV testu byla opět blízká nule, což znamená, že nulová hypotéza o shodnost středních hodnot byla zamítnuta a mez obory je tedy významný rozdíl. 34

by bylo stanoveno, mez kterým obory konkrétně je tento statstcky významný rozdíl, byla použta metoda pro mnohonásobné porovnávání. Dle této metody bylo například zjštěno, že Fakulta elektrotechncká, Fakulta ekonomcká a an Fakulta aplkovaných věd nemá dva vlastní obory, které by se mez sebou významně lšly. U oborů Geomatka a Stavební nženýrství dokonce nebyl prokázán rozdíl an v porovnání s obory ostatních fakult. Také u oboru Desgn nebyl prokázán rozdíl mez jným oborem, stejně jako v mnulých letech. Tento obor má opět největší nterval spolehlvost. Naopak obor, u kterého bylo prokázáno, že se nejvíce lší od ostatních oborů, byl obor Management obchodních čnností. 7.4 Všechny roky dohromady V tomto případě byly sledovány výsledky všech oborů pro všechny roky dohromady. Srovnání celkových výsledků všech oborů je zobrazeno na obrázku 7.6. Obrázek 7.6: Srovnání všech oborů 1-1 Celkově dosáhly nejlepších výsledků obory v rámc programu Matematka, nejhorších obor Radologcký asstent, stejně jako tomu bylo ve všech sledovaných letech odděleně. Z grafu je dále patrné, že nejlepších výsledků dosahovaly obory Fakulty aplkovaných věd. 35

Pro zjštění, zda studovaný obor má vlv na výsledky testů, byla použta metoda NOV v softwaru Statstca. P-hodnota byla stejně jako v předchozích případech blízká nule, proto byla nulová hypotéza o shodnost středních hodnot jednotlvých oborů zamítnuta. Obor je statstcky významným faktorem. Pro určení rozdílných dvojc oborů byla použta Tukeyova metoda pro nestejný počet pozorování ve skupnách. Pomocí této metody mnohonásobného porovnávání bylo prokázáno velké množství dvojc, mez kterým je statstcky významný rozdíl. Například obor s nejlepším průměrem, tedy Matematka, se významně nelšl pouze od oborů plkované vědy a nformatka, Geomatka a Počítačové modelování v technce, což jsou všechno obory Fakulty aplkovaných věd. Od ostatních oborů se jž významně lšl. Nebyl zaznamenán žádný obor, který by nebyl významně rozdílný od některého z ostatních oborů. Pro ověření, zda má na výsledky vstupních testů vlv také rok, ve kterém byly testy provedeny, byla použta dvourozměrná metoda NOV, kde k faktoru obor přbyl právě faktor rok. Jak je vdět na obrázku 7.7, v tomto případě byla p-hodnota testu,66, takže rok má statstcky významný vlv na výsledky testů. Obrázek 7.7: Ukázka výsledné tabulky NOV Metodou mnohonásobného porovnávání bylo prokázáno, že se významně lšl rok 11 od ostatních dvou let, vz obrázek 7.8, kde je výsledná tabulka metody mnohonásobného porovnávání. Graf na obrázku 7.9 odpovídá výpočtům, zde lze vdět, že rok 11 se významně lšl od ostatních let. Obrázek 7.8: Ukázka výsledné tabulky mnohonásobného porovnávání 36

Obrázek 7.9: Srovnání výsledků v jednotlvých letech Následně byl sledován vývoj výsledků v jednotlvých letech pro každý obor samostatně. Celkový přehled oborů je na obrázku 7.1. Z grafu je dobře patrné, že nejlepších výsledků dosahoval obor Matematka. Obor Geomatka byl v roce 1 a 11 druhým nejlepším oborem, avšak v roce 1 došlo k poklesu průměrného výsledku. Nejhorším oborem byl obor Radologcký asstent. Obrázek 7.1: Vývoj všech oborů v jednotlvých letech 37

8 Závěr a shrnutí výsledků V bakalářské prác byla zpracována data získaná ze vstupních testů z matematky z let 1, 11 a 1. Data byla upravena v softwaru MS Offce Excel, následně rozdělena do skupn podle fakulty, oboru a roku testování a poté byly vypočteny základní statstky jednotlvých skupn. Další zpracování dat bylo provedeno v softwaru Statstca 1. Ve výpočtech byla testována nulová hypotéza o shodnost středních hodnot jednotlvých oborů, jelkož bylo sledováno, zda má studovaný obor vlv na výsledky vstupních testů z matematky. Dále byla zjšťována souvslost výsledků testů na roce. Všechny testy byly provedeny na hladně významnost, 5. Nejdříve byly zpracovány obory Fakulty aplkovaných věd. Jelkož se zúčastnlo velké množství oborů, byl student pro lepší přehlednost rozdělen do skupn dle studovaných programů. Jak v jednotlvých letech, tak pro všechny roky dohromady dosáhl nejlepších výsledků program Matematka, naopak nejhorších program Stavební nženýrství. Dále bylo sledováno, zda má studovaný program vlv na výsledky vstupních testů. Pro data z roku 1 bylo prokázáno, že studovaný program je statstcky významným faktorem, tedy že má významný vlv na výsledky testů. Metodou mnohonásobného porovnávání bylo vyhodnoceno, že se významně lší výsledky programu Stavební nženýrství od výsledků všech ostatních programů. Pro rok 11 bylo opět prokázáno, že studovaný program má vlv na výsledky testů, přčemž bylo zjštěno, že program Matematka se významně lšl od programu Stavební nženýrství a programu Inženýrská nformatka. Program významně ovlvnl výsledky testů v roce 1, kdy byl opět prokázán rozdíl mez programy Matematka a Stavební nženýrství a dále rozdíl mez programem Stavební nženýrství a plkované vědy a nformatka. Př zpracování výsledků programů Fakulty aplkovaných věd pro všechny roky dohromady bylo pomocí metody NOV opět prokázáno, že studovaný program má statstcky významný vlv na výsledky studentů ve vstupních testech z matematky. Program Stavební nženýrství se významně lšl od všech ostatních programů a dále se významně lšl program Inženýrská nformatka od programu plkované vědy a nformatka a programu Matematka. Vlv roku na výsledky testů nebyl dvoufaktorovou metodou NOV dokázán. Výsledky v jednotlvých letech se od sebe přílš nelšly. Tento výpočet byl potvrzen pomocí jednoduché regrese. V šesté kaptole byly sledovány obory Fakulty elektrotechncké. Po upravení dat byly spočteny základní statstky jednotlvých oborů. Nejlepšího průměrného výsledku dosáhl obor plkovaná elektrotechnka v roce 1, naopak nejhoršího obor Techncká ekologe v roce 1. Nejdříve byly opět uvažovány jednotlvé roky samostatně. V roce 1 bylo 38

jednofaktorovou metodou NOV stanoveno, že studovaný obor má statstcky významný vlv na výsledky testů. Mnohonásobným porovnáváním bylo zjštěno, že obor s nejnžším průměrem se významně lšl od prvních dvou nejvyšších průměrů, tedy obor Techncká ekologe od oborů Elektronka a telekomunkace a Elektrotechnka a energetka. Rok 11 byl jedným rokem, kdy nebylo prokázáno, že obor statstcky významně ovlvňuje výsledky testů. Na výsledky z roku 1 jž měl obor významný vlv. Metodou mnohonásobného porovnávání bylo určeno, že se významně lšl obor plkovaná elektrotechnka od oboru Komerční elektrotechnka a oboru Techncká ekologe. I výsledky za všechny roky dohromady studovaný obor ovlvnl významně. Rozdíl byl zaznamenán mez čtyřm dvojcem oborů. Dále bylo sledováno, zda má na výsledky vstupních testů vlv také rok, ve kterém byly testy provedeny. Dvoufaktorová metoda NOV neprokázala, že by měl rok na výsledky významný vlv. Následně byla použta jednoduchá regrese k analyzování vlvu roku na výsledky pro jednotlvé obory zvlášť. Tento vlv byl prokázán u oboru plkovaná elektrotechnka a Techncká ekologe. Poslední kaptola byla věnována oborům všech fakult. Nejlepšího výsledku dosáhly obory v rámc programu Matematka Fakulty aplkovaných věd v roce 11, naopak nejhoršího obor Radologcký asstent Fakulty zdravotních studí v roce 1. Pro všechny sledované roky a zároveň pro výsledky ze všech let dohromady bylo stanoveno, že studovaný obor má statstcky významný vlv na výsledky vstupních testů. Dále nás zajímalo, zda výsledky ovlvňuje také rok, ve kterém jsou testy provedeny. Pro ověření byla použta dvoufaktorová NOV, kdy bylo prokázáno, že rok také významně ovlvňuje výsledky. Mnohonásobným porovnáváním bylo zjštěno, že se významně odlšovaly výsledky testů z roku 11 oprot výsledkům z ostatních let. 39

9 Seznam lteratury [1] Ref Jří: Metody matematcké statstky, Západočeská unverzta v Plzn, Plzeň,. [] nděl Jří: Matematcká statstka, SNTL, lfa, Praha, 1985. [3] Šedvá Blanka, Výpočtová statstka, ZČU, výukový text, http://home.zcu.cz/~sedva/stav.htm, 13-4-8. [4] Šedvá Blanka, Mnohorozměrné statstcké metody, ZČU, výukový text, http://home.zcu.cz/~sedva/msm.htm, 13-4-8. [5] Hendl Jan, Přehled statstckých metod zpracování dat, Portál s.r.o., Praha, 6. [6] Beranová Petra, Blažková Lenka, Uldrch Mloš, Stručný manuál k ovládání programu STTISTIC, StatSoft, Praha, 11, http://www.statsoft.cz/podpora/kestazen/strucny-manual-k-software-statstca/, 13-3-4. 4