VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 10 Mgr. Petr Otipka Ostrava 01 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita Ostrava ISBN 978-80-48-04-6 Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu České republiky v rámci řešení projektu: CZ.1.07/..00/15.046, MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD
OBSAH 10 REGRESE A KORELACE... 10.1 Řešené úlohy... 10.1.1 Úlohy k řešení... 10.1. Výsledky úloh k řešení... 4 10.1. Sada testovacích otázek... 5 10.1.4 Správné odpovědi k testovacím otázkám... 5 CZ.1.07/..00/15.046
10 REGRESE A KORELACE 10.1 ŘEŠENÉ ÚLOHY 10.1.1 Úlohy k řešení 1.1. Charakterizujte závislost proměnné y na x regresní funkcí ve tvaru: b a) Y = a + x b) Y = ax + bx + c Určete indexy korelace x 1 1 4 6 y 0 1 4 5 5 1.. Při seskoku parašutisty byla měřena závislost mezi rychlostí v [m/s] a tlakem p [0,1mPa] na povrchu padáku. Výsledky vyrovnejte parabolou p = a + bv. Vypočtěte index korelace. v,4,5 5 6,89 10 p 0,0141 0,081 0,056 0,115 0,5 1.. Charakterizujte těsnost zvolené závislosti ve tvaru Y = a + b. log x mezi proměnnými x a y. Vypočtěte index korelace. x 1 1 5 6 7 7 y 70 104 16 10 00 50 40 60 1.4. Zjišťovalo se, zda u souboru chlapců je závislost v počtu provedených shybů a kliků. Výsledky jsou zaznamenány v tabulce: chlapec 1 4 5 6 7 8 9 10 11 1 1 14 15 počet shybů 1 0 5 6 1 4 5 6 1 1 8 počet kliků 10 15 15 0 40 5 7 1 0 5 41 10 14 9 64 a) Určete, zda je mezi počtem shybů a počtem kliků silná lineární závislost, určete její míru. b) Najděte nejvhodnější regresní funkci závislosti mezi počtem shybů a kliků. 1.5. V tabulce jsou průměrné doby trvání slunečního svitu za období 1961-1990 v Praze- Ruzyni (argument x) a dlouhodobé průměrné teploty vzduchu za období 1961 1990 v Praze-Ruzyni (argument y). leden únor březen duben květen červen červenec srpen září říjen listopad prosinec x [h] 50,0 7,4 14,7 167,6 14,0 18,6 6,7 1, 161,0 10,8 5,6 46,7 y [ C] -,4-0,9,0 7,7 1,7 15,9 17,5 17,0 1, 8,,9-0,6 Najděte vhodnou regresní funkci závislosti y na x a vypočtěte index determinace. 1.6. Tabulka obsahuje data o vývoji indexu spotřebitelských cen životních nákladů v ČR. průměr roku 005 = 100 rok 1994 1995 1996 1997 1998 1999 000 001 00 00 004 005 006 007 008 009 010 index 59,1 64,5 70, 76, 84,4 86, 89,4 9,6 95,4 95,5 98,1 100,0 10,5 105,4 11,1 11, 114,9 Proložte daty vhodnou regresní funkci a využijte ji k odhadu hodnoty indexu v roce 015. CZ.1.07/..00/15.046
4 1.7. Podobně jako v předchozím případě z údajů v tabulce průměrných mezd v ČR odhadněte průměrný plat v roce 015. rok 000 001 00 00 004 005 006 007 008 009 010 mzda 1 19 14 78 15 54 16 40 17 466 18 44 19 546 0 957 59 44 797 1.8. Popište závislost produktivity práce (v desítkách kusů za hodinu) na % plnění norem x a průměrném věku pracovníků z v pěti firmách, zabývajících se výrobou stejného druhu výrobků pomocí regresní roviny. Vypočítejte hodnotu indexu korelace a odhadněte hodnotu produktivity práce při plnění norem na 106 % a při průměrném věku pracovníků let. y - produktivita 1 x - plnění normy 0,9 1,0 1,05 1, 1,4 z - průměrný věk 0 7 6 7 5 1.9. V tabulce jsou uvedeny hodnoty tří nezávisle proměnných x 1, x a x a hodnota závisle proměnné y. Stanovte lineární regresi mezi těmito veličinami a hodnotu indexu determinace. y 11 7 10 11 10 9 15 16 x 1 1-1 0 4 4 1 x 1-1 -1 0 x 1 0-0 -1 1 1.10. Posuďte vliv jednotlivých vybraných ukazatelů parních elektráren v roce 1984 na měrné náklady elektráren. Úlohu řešte vícenásobnou lineární regresní analýzou. elektrárna y x 1 x x x 4 Mělník 49 0,95 6,86 14,01 1,9 Počerady 1 0,7 7,56 1,06 11,74 Chvaletice 56,4 6,79 15,0 11,74 Dětmarovice 06 4,4 7,5 17,8 11,7 Tušimice 1 7, 6,58 10,8 1,49 Tušimice 1,6 7,5 10,1 1,1 Prunéřov 1 49 5,18 6,66 11,6 1,49 Prunéřov 10 4,4 7,47 11,5 11,15 y... měrné náklady [Kč/MWh], x 1... poruchy [%], x... využití pohotového výkonu [tisíce hodin], x... cena paliva [Kč/GJ], x 4... měrná spotřeba [GJ/MWh] 10.1. Výsledky úloh k řešení 1.1. 5, 565 a) Y = 6, 06 ; I = 0, 985 ; b) Y = 15, +, 94x 0, 91x ; I = 0, 99 x 1.. p = 0, 00144 + 0, 00506v ; I = 0, 9996 1.. Y = 88, + 19154,. log x; I = 0, 96 1.4. Lineární funkce: Y = 6,699x + 1,646; I = 0,97577 Kvadratická funkce: Y = 0,4x + 4,8667x +,754; I = 0,904 1.5. Y = 0, 098x 5, 766, I = 0,888 1.6. index 015 = 1,8 1.7. mzda 015 = 9699 1.8. Y =,456x - 0,0905z + 0,9640; 1,5071 1.9. Y = 0,9799x 1, 680x + 1,844x + 10,1816; I = 0,966 1 CZ.1.07/..00/15.046
5 1.10. Y = + x x + x + x I = 17,561, 95 1 19,545 1,187 41, 457 4, 0,9908 10.1. Sada testovacích otázek T10.1. Index korelace používáme k a) posouzení míry lineární závislosti mezi veličinami. b) vyjádření závislosti mezi dvěma statistickými znaky. c) posouzení vhodnosti regresní funkce. T10.. Regresí rozumíme a) míru (intenzitu) závislosti statistických znaků. b) vystižení charakteru závislosti mezi veličinami a určení její konkrétní formy. c) vypočtení konstant a, b z rovnice Y = ax + b. T10.. Metodu nejmenších čtverců odchylek používáme ve statistice k a) nalezení nejlepšího funkčního předpisu statistické závislosti. b) vypočtení koeficientu korelace. c) vypočtení indexu korelace. T10.4. Koeficient korelace používáme k a) posouzení míry lineární závislosti mezi veličinami. b) vyjádření závislosti mezi dvěma statistickými znaky. c) posouzení vhodnosti regresní funkce. T10.5. Index korelace může nabývat v případě lineární regrese hodnot z intervalu 1,1 a) 0,1 b) 0, ) c) T10.6. Při různých rychlostech byly naměřeny následující hodnoty spotřeby automobilu: rychlost x 50 60 70 80 90 100 110 10 10 spotřeba y 8,5 7,8 7, 7,1 6,9 7 7,4 7,9 8,6 Která regresní křivka bude nejlépe vystihovat závislost mezi rychlostí x a spotřebou y (hodnoty a, b, případně c by se vypočetly například metodou nejmenších čtverců)? a) Y = a + bx b) Y = a + bx + cx c) Y = a + b.logx T10.7. Blíží-li se hodnota indexu korelace k nule, pak a) se mezi danými veličinami jedná vždy o slabou lineární závislost. b) se mezi danými veličinami jedná vždy o silnou lineární závislost. c) vypočtená regresní funkce nevystihuje statistickou závislost mezi veličinami. 10.1.4 Správné odpovědi k testovacím otázkám T10.1. c) T10.. b) T10.. a) T10.4. a) T10.5. b) T10.6. b) T10.7. c) CZ.1.07/..00/15.046