Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Podobné dokumenty
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

= = 2368

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Regresní a korelační analýza

Regresní a korelační analýza

Regresní a korelační analýza

Regresní a korelační analýza

Regresní analýza 1. Regresní analýza

Tomáš Karel LS 2012/2013

Bodové a intervalové odhady parametrů v regresním modelu

Regresní a korelační analýza

Statistika (KMI/PSTAT)

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

KGG/STG Statistika pro geografy

Plánování experimentu

LINEÁRNÍ REGRESE. Lineární regresní model

2 ) 4, Φ 1 (1 0,005)

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Normální (Gaussovo) rozdělení

Lineární regrese. Komentované řešení pomocí MS Excel

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

UNIVERZITA PARDUBICE

Charakteristika datového souboru

Inovace bakalářského studijního oboru Aplikovaná chemie

You created this PDF from an application that is not licensed to print to novapdf printer (

Protokol č. 1. Tloušťková struktura. Zadání:

Bodové a intervalové odhady parametrů v regresním modelu

Semestrální práce. 2. semestr

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Regresní analýza. Eva Jarošová

Národníinformačnístředisko pro podporu jakosti

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Normální (Gaussovo) rozdělení

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování statistických hypotéz

Korelační a regresní analýza

PRAVDĚPODOBNOST A STATISTIKA

Zápočtová práce STATISTIKA I

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Optimální trvanlivost nástroje

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Kalibrace a limity její přesnosti

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

12. cvičení z PST. 20. prosince 2017

Jednofaktorová analýza rozptylu

STATISTICKÉ TESTY VÝZNAMNOSTI

Tomáš Karel LS 2012/2013

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Korelace. Komentované řešení pomocí MS Excel

INDUKTIVNÍ STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Téma 9: Vícenásobná regrese

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

KGG/STG Statistika pro geografy

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Porovnání dvou výběrů

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

4ST201 STATISTIKA CVIČENÍ Č. 7

odpovídá jedna a jen jedna hodnota jiných

Regresní a korelační analýza

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

, Brno Hanuš Vavrčík Základy statistiky ve vědě

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Testy statistických hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

4ST201 STATISTIKA CVIČENÍ Č. 8

4EK211 Základy ekonometrie

Ilustrační příklad odhadu LRM v SW Gretl

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

4EK211 Základy ekonometrie

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

4EK211 Základy ekonometrie

AVDAT Geometrie metody nejmenších čtverců

Jednovýběrové testy. Komentované řešení pomocí MS Excel

UNIVERZITA PARDUBICE

Statistická analýza jednorozměrných dat

Stručný úvod do testování statistických hypotéz

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Cvičení ze statistiky - 3. Filip Děchtěrenko

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Transkript:

Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce. Závislost studujme na hladině významnosti 0,05. id Y výnos [t/ha] x hnojivo [kg/ha] 1 40 100 2 50 200 3 50 300 4 70 400 5 65 500 6 65 600 7 80 700 8 80 750 Celkem 500 3550 Řešení 1 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =8. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id Y x yx x2 1 40 100 4000 10000 2 50 200 10000 40000 3 50 300 15000 90000 4 70 400 28000 160000 5 65 500 32500 250000 6 65 600 39000 360000 7 80 700 56000 490000 8 80 750 60000 562500 Celkem 500 3550 244500 1962500 Průměr 62,5 443,75 27734,38 Dosadíme do prvního vzorce a dostaneme = 244500 8 443,75 62,5 1962500 8 443,75 = 244500 221879 1962500 1575313 = 22625 387187,5 =0,058434 Tento výsledek dosadíme do druhého vzorce a dostaneme =62,5 0,058434 443,75=62,5 25,93019=36,56981 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě množství použitelného hnojiva odhadneme výnos pomocí funkce =0,058434+36,56981. 1

Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. POZOR! V tomto případě je osa svislá a osa vodorovná (podle pořadí sloupců v MS Excel). Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. 800 700 600 500 400 300 200 100 Závislost výnosu na množství hnojiva 0 0 10 20 30 40 50 60 70 80 90 Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id Y x yx x2 Y-(a+bx) (Y-(a+bx))2 1 40 100 4000 10000-2,41321 5,823582504 2 50 200 10000 40000 1,74339 3,039408692 3 50 300 15000 90000-4,10001 16,810082 4 70 400 28000 160000 10,05659 101,1350024 5 65 500 32500 250000-0,78681 0,619069976 6 65 600 39000 360000-6,63021 43,95968464 7 80 700 56000 490000 2,52639 6,382646432 8 80 750 60000 562500-0,39531 0,156269996 Celkem 500 3550 244500 1962500 177,9257467 Průměr 62,5 443,75 27734,38 n 8 Se 177,9257 b 0,058434 s2 29,65429 a 36,56981 s 5,445575 Dostáváme tedy ) =177,9257 2

Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 / = 177,9257 = 177,9257 =29,65429 8 2 6 Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =029,65429=5,445575 Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 0,058434 5,445575 01962500 8 443,75 =0,010730547 01962500 8 196914,0625 = 0,010730547 01962500 1575312,5 = 0,010730547 0387187,5 =0,010730547 622,2439232=6,677 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 6,677 =6,677 2,447=9 <: =1 0,05 2 >=9?=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 0,058434 + 36,56981je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle vzorce @ =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. ) =A * =40 62,5 +50 62,5 +50 62,5 +70 62,5 +65 62,5 +65 62,5 +80 62,5 +80 62,5 = 22,5 + 12,5 + 12,5 +7,5 +2,5 +2,5 +17,5 +17,5 =506,25+156,25+15,25+56,25+6,25+6,25+306,25+306,25=1500 @ =1 177,9257 =1 0,118617=0,881383 1500 Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 3

Příklad 2 Měřením bylo získáno 10 hodnot statistických znaků B a. Odhadněte parametry regresní přímky, která vystihuje závislost na B. Rozhodněte o kvalitě regresního modelu pomocí koeficientu determinance. B:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 : 290, 365, 420, 445, 501, 598, 635, 687, 750, 880 Řešení 2 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =10. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x2 1 1 290 290 1 2 2 365 730 4 3 3 420 1260 9 4 4 445 1780 16 5 5 501 2505 25 6 6 598 3588 36 7 7 635 4445 49 8 8 687 5496 64 9 9 750 6750 81 10 10 880 8800 100 Celkem 55 5571 35644 385 Průměr 5,5 557,1 3564,4 Dosadíme do prvního vzorce a dostaneme = 35644 10 5,5 557,1 385 10 5,5 = 35644 30640,5 = 5003,5 385 302,5 82,5 =60,64848 Tento výsledek dosadíme do druhého vzorce a dostaneme =557,1 60,64848 5,5=557,1 333,5667=223,5333 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =60,64848+223,5333. Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. 4

Závislost statistických znaků X a Y 1000 900 800 700 600 500 400 300 200 100 0 0 2 4 6 8 10 12 Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 1 1 290 290 1 5,81822 33,851684 2 2 365 730 4 20,16974 406,81841 3 3 420 1260 9 14,52126 210,86699 4 4 445 1780 16-21,1272 446,35942 5 5 501 2505 25-25,7757 664,38671 6 6 598 3588 36 10,57582 111,84797 7 7 635 4445 49-13,0727 170,89444 8 8 687 5496 64-21,7211 471,80792 9 9 750 6750 81-19,3696 375,18218 10 10 880 8800 100 49,9819 2498,1903 Celkem 55 5571 35644 385 5390,2061 Průměr 5,5 557,1 3564,4 n 10 a 223,5333 b 60,64848 Dostáváme tedy ) =5390,2061 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 5

/ = 5390,2061 = 5390,2061 =673,7758 10 2 8 Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =0673,7758=25,95719 Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 60,64848 25,95719 0385 10 5,5 =2,336481 0385 10 30,25=2,336481 0385 302,5 =2,336481 082,5=2,336481 9,082951=21,22214 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 21,22214 =21,22214 2,306=9 2: =1 0,05 2 >=9 <=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 60,64848 + 223,5333je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle vzorce @ =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. ) =A * =290 557,1 +365 557,1 +420 557,1 +445 557,1 +501 557,1 +598 557,1 +635 557,1 +687 557,1 +750 557,1 +880 557,1 = 267,1 + 192,1 + 137,1 + 112,1 + 56,1 +40,9 +77,9 +129,9 +192,9 +322,9 =71342,41+36902,41+18796,41+12566,41+3147,21+1672,81 +6068,41+16874,01+37210,41+104264,41=308844,9 @ =1 5390,2061 308844,9 =1 0,0174528=0,9825472 Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 6

Příklad 3 Charakterizujte závislost proměnné na B lineární regresní funkcí. B:12, 14, 16, 18, 20, 24, 26, 28, 30 :186, 216, 246, 276, 306, 366, 396, 426, 456 Řešení 3 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =9. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x2 1 12 186 2232 144 2 14 216 3024 196 3 16 246 3936 256 4 18 276 4968 324 5 20 306 6120 400 6 24 366 8784 576 7 26 396 10296 676 8 28 426 11928 784 9 30 456 13680 900 Celkem 188 2874 64968 4256 Průměr 20,88889 319,3333 7218,667 Dosadíme do prvního vzorce a dostaneme = 64968 9 20,9 319,3 4256 9 20,9 = 64968 60060,3 4256 3931,3 =4907,7 324,7 =15,11401 Tento výsledek dosadíme do druhého vzorce a dostaneme =319,3 15,11401 20,9=319,3 315,7149=3,61847 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =15,11401+3,61847. Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. 7

Závislost Y na X 500 450 400 350 300 250 200 150 100 50 0 0 5 10 15 20 25 30 35 Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 1 12 186 2232 144 1,06 1,1236 2 14 216 3024 196 0,84 0,7056 3 16 246 3936 256 0,62 0,3844 4 18 276 4968 324 0,4 0,16 5 20 306 6120 400 0,18 0,0324 6 24 366 8784 576-0,26 0,0676 7 26 396 10296 676-0,48 0,2304 8 28 426 11928 784-0,7 0,49 9 30 456 13680 900-0,92 0,8464 Celkem 188 2874 64968 4256 4,0404 Průměr 20,88889 319,3333 7218,667 n 9 a 3,62 b 15,11 Dostáváme tedy ) =4,0404 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 8

/ = 4,0404 9 2 =4,0404 =0,5772 7 Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =00,5772=0,7597368 Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 15,11401 0,7597368 04256 9 20,9 =19,893744 04256 3931,29=19,893744 0324,71 =19,893744 18,01971=315,7149 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 315,7149 =315,7149 2,365=9 D: =1 0,05 2 >=9 E=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 15,11401 + 3,61847je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle vzorce @ =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. Pomůžeme si dalším rozšířením tabulky ) =A id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 Y-pY (Y-pY)2 1 12 186 2232 144 1,06 1,1236-133,333 17777,778 2 14 216 3024 196 0,84 0,7056-103,333 10677,778 3 16 246 3936 256 0,62 0,3844-73,3333 5377,7778 4 18 276 4968 324 0,4 0,16-43,3333 1877,7778 5 20 306 6120 400 0,18 0,0324-13,3333 177,77778 6 24 366 8784 576-0,26 0,0676 46,66667 2177,7778 7 26 396 10296 676-0,48 0,2304 76,66667 5877,7778 8 28 426 11928 784-0,7 0,49 106,6667 11377,778 9 30 456 13680 900-0,92 0,8464 136,6667 18677,778 Celkem 188 2874 64968 4256 4,0404 74000 Průměr 20,88889 319,3333 7218,667 n 9 a 3,62 b 15,11 9

* =74000 @ =1 4,0404 74000 =1 0,0000546=0,9999454 Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 10

Příklad 4 Charakterizujte závislost proměnné na B lineární regresní funkcí. B:5, 15, 25, 35, 45, 55, 65 :3.5, 5.2, 5.5, 6.1, 5.9, 6.4, 7.8 Řešení 4 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =7. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x2 1 5 3,5 17,5 25 2 15 5,2 78 225 3 25 5,5 137,5 625 4 35 6,1 213,5 1225 5 45 5,9 265,5 2025 6 55 6,4 352 3025 7 65 7,8 507 4225 Celkem 245 40,4 1571 11375 Průměr 35 5,771429 224,4286 Dosadíme do prvního vzorce a dostaneme = 1571 7 35 5,77 11375 7 35 = 1571 1413,65 11375 8575 =157,35 2800 =0,056196 Tento výsledek dosadíme do druhého vzorce a dostaneme =5,77 0,056196 35=5,77 1,966875=3,804554 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =0,056196+3,804554. Závislost X a Y 9 8 7 6 5 4 3 2 1 0 0 10 20 30 40 50 60 70 11

Celou situaci jsme znázornili grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 1 5 3,5 17,5 25-0,58553 0,3428501 2 15 5,2 78 225 0,552506 0,3052629 3 25 5,5 137,5 625 0,290546 0,084417 4 35 6,1 213,5 1225 0,328586 0,1079688 5 45 5,9 265,5 2025-0,43337 0,187813 6 55 6,4 352 3025-0,49533 0,2453558 7 65 7,8 507 4225 0,342706 0,1174474 Celkem 245 40,4 1571 11375 1,3911149 Průměr 35 5,771429 224,4286 n 7 a 3,804554 b 0,056196 Dostáváme tedy ) =1,3911149 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 / = 1,3911149 = 1,3911149 =0,278223 7 2 5 Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =00,278223=0,5274685 Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 0,056196 0,5274685 011375 7 35 =0,1065399 11375 8575=0,1065399 2800 =0,1065399 52,91503=5,637561 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 12

5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 5,637561 =5,637561 2,571=9 E: =1 0,05 2 >=9 H=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 0,056196 + 3,804554 je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle vzorce @ =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. Pomůžeme si dalším rozšířením tabulky ) =A id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 Y-pY (Y-pY)2 1 5 3,5 17,5 25-0,58553 0,3428501-2,27143 5,1593878 2 15 5,2 78 225 0,552506 0,3052629-0,57143 0,3265306 3 25 5,5 137,5 625 0,290546 0,084417-0,27143 0,0736735 4 35 6,1 213,5 1225 0,328586 0,1079688 0,328571 0,1079592 5 45 5,9 265,5 2025-0,43337 0,187813 0,128571 0,0165306 6 55 6,4 352 3025-0,49533 0,2453558 0,628571 0,395102 7 65 7,8 507 4225 0,342706 0,1174474 2,028571 4,115102 Celkem 245 40,4 1571 11375 1,3911149 10,194286 Průměr 35 5,771429 224,4286 n 7 a 3,804554 b 0,056196 * =10,194286 @ =1 1,3911149 10,194286 =1 0,1364603=0,8635397 Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 13