VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA PODNIKATELSKÁ ÚSTAV MANAGEMENTU FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF MANAGEMENT STATISTICKÉ METODY PRO POPIS PROVOZU RESTAURACE STATISTICAL METHODS FOR DESCRIPTION OF RUNNING A RESTAURANT DIPLOMOVÁ PRÁCE MASTER'S THESIS AUTOR PRÁCE AUTHOR VEDOUCÍ PRÁCE SUPERVISOR Bc. LENKA NOVOTNÁ doc. RNDr. JIŘÍ KROPÁČ, CSc. BRNO 2010
Vysoké učení techncké v Brně Akademcký rok: 2009/2010 Fakulta podnkatelská Ústav managementu ZADÁNÍ DIPLOMOVÉ PRÁCE Novotná Lenka, Bc. Řízení a ekonomka podnku (6208T097) Ředtel ústavu Vám v souladu se zákonem č.111/1998 o vysokých školách, Studjním a zkušebním řádem VUT v Brně a Směrncí děkana pro realzac bakalářských a magsterských studjních programů zadává dplomovou prác s názvem: Statstcké metody pro pops provozu restaurace v anglckém jazyce: Statstcal Methods for Descrpton of Runnng a Restaurant Úvod Teoretcká východska práce Cíl práce, postupy zpracování Analýza problému a současné stuace Vlastní návrhy řešení, přínos návrhů řešení Závěr Seznam použté lteratury Přílohy Pokyny pro vypracování: Podle 60 zákona č. 121/2000 Sb. (autorský zákon) v platném znění, je tato práce "Školním dílem". Využtí této práce se řídí právním režmem autorského zákona. Ctace povoluje Fakulta podnkatelská Vysokého učení technckého v Brně. Podmínkou externího využtí této práce je uzavření "Lcenční smlouvy" dle autorského zákona.
Seznam odborné lteratury: KROPÁČ, J. Statstka B. Brno : Fakulta podnkatelská VUT, 2007. ISBN 80-214-3295-0. CIPRA, T. Analýza časových řad s aplkacem v ekonom. Praha : SNTL/ALFA, 1986. CYHELSKÝ, L., aj. Základy teore statstky pro ekonomy. Praha : SNTL/ALFA, 1979. SEGER, J., aj. Statstka v hospodářství. Praha : ETC Publshng, 1998. ISBN 80-86006-56-5. Vedoucí dplomové práce: doc. RNDr. Jří Kropáč, CSc. Termín odevzdání dplomové práce je stanoven časovým plánem akademckého roku 2009/2010. L.S. PhDr. Martna Raštcová, Ph.D. Ředtel ústavu doc. RNDr. Anna Putnová, Ph.D., MBA V Brně, dne 16.05.2010
Abstrakt Práce je napsána za účelem ukázky využtí statstckých metod pro pops vývoje ekonomckých procesů v podnku. Je rozdělena do dvou částí. První část je zaměřena na teoretcké poznatky o regulačních dagramech a časových řadách. Druhou část tvoří kaptoly zabývající se jejch praktckým využtím. Součástí práce je drobná aplkace pro tvorbu regulačních dagramů. Abstract The dploma thess s wrtten wth a vew to llustrate applcaton of statstcal methods descrbng progress of economcal processes n company. The thess s dvded nto two separated parts. Frst part focuses on theoretcal peces of knowledge about control charts and tme seres. Second part s composed from chapters that are focused on ts practcal usage. As smple applcaton for control chart makng s enclosed. 3
Klíčová slova Shewartovy regulační dagramy, Kolmogorov-Smrnovův test, časová řada, sezónní složka, vyrovnání časové řady, regresní přímka. Key words Shewart s control charts, Kolmogorov-Smrnov test, tme seres, seasonal component, tme seres adjustment, regresson lne. 4
Bblografcká ctace NOVOTNÁ, L. Statstcké metody pro pops provozu restaurace. Brno: Vysoké učení techncké v Brně, Fakulta podnkatelská, 2010, 68 s. Vedoucí dplomové práce doc. RNDr. Jří Kropáč, CSc. 5
Čestné prohlášení Prohlašuj, že tato práce je mým autorským dílem, které jsem vypracovala samostatně. Uvedla jsem všechny lterární prameny, ze kterých jsem čerpala. V Brně dne...... podps 6
Poděkování V první řadě bych chtěla poděkovat vedoucímu mé dplomové práce, doc. RNDr. Jřímu Kropáčov, CSc., za jeho cenné přpomínky, postřehy a vedení během psaní této dplomové práce. 7
Obsah Úvod... 10 1. Vymezení problému a cíl práce... 11 1.1. Vymezení problému a nástn realzace... 11 1.2. Cíl práce... 11 2. Časové řady... 12 2.1. Vymezení základních pojmů... 12 2.2. Charakterstky časových řad... 13 2.3. Dekompozce časové řady... 15 2.4. Vyhlazení časové řady... 17 2.5. Modelace sezónní složky... 19 3. Regulační dagramy... 21 3.1. Vymezení základních pojmů... 21 3.2. Shewartovy regulační dagramy... 22 3.3. Regulační dagramy (x, Rkl,)... 24 3.4. Testy nenáhodných seskupení... 26 3.5. Kolmogorov-Smrnovův test... 29 4. Aplkace v prax... 30 4.1. Pops podnku... 30 4.2. Analýza týdenních tržeb... 32 4.2.1. Subjektvní posouzení... 33 4.2.2. Určení základních charakterstk... 33 4.2.3. Test statstcké významnost regresního koefcentu b 2... 36 4.2.4. Výpočet rezduí... 39 4.2.5. Test normálního rozdělení dat... 40 4.2.6. Analýza rezduí pomocí regulačních dagramů... 42 8
4.3. Analýza měsíčních tržeb... 45 4.3.1. Subjektvní posouzení grafu... 47 4.3.2. Určení základních charakterstk časové řady... 47 4.3.3. Vyrovnání časové řady... 50 4.3.4. Test statstcké významnost koefcentu b 2 od nuly... 52 4.3.4. Určení sezónní složky... 53 5. Metodcký postup pro provozovatele podnku... 57 5.1. Příprava a sběr dat... 57 5.2. Práce s aplkací... 58 Závěr... 65 Lteratura... 66 Seznam obrázků, grafů a tabulek... 67 Přílohy... 68 9
Úvod Na veškeré čnnost probíhající na tomto světě působí mnoho vlvů, některé předvídat lze, některé ne. Právě tyto nepředvídatelné vlvy lze označt jako náhodu. Abychom byl schopn některé potřebné procesy zdokonalovat č predkovat, lze využít statstckých metod zaměřených na statstckou regulac a analýzu časových řad. Jedná se o problematku, která je probírána v předmětu Aplkovaná statstka na Fakultě podnkatelské Vysokého učení technckého v Brně. Práce se soustřeďuje na aplkac statstckých metod využtelných př sledování provozu jakéhokolv restauračního zařízení. Konkrétně je zde použta problematka časových řad a regulačních dagramů, která je nezbytná pro následné správné zpracování získaných dat, jejch věrnou nterpretac a vyhodnocování. Analýza dat a jejch nterpretace tvoří druhou část této práce. 10
1. Vymezení problému a cíl práce 1.1. Vymezení problému a nástn realzace Výkonnost jakéhokolv podnku se obvykle se na první pohled posuzuje dle výše vykázaných tržeb. Jejch mmořádné výkyvy, sezónní výkyvy č dlouhodobý trend jsou jevy, které je vhodné sledovat a analyzovat. Neboť takto se dá určt mnoho příčn, jež ovlvňují tržby podnku a lze tak některé negatvní příčny nejen dentfkovat, ale v mnohých případech následně odstrant. Práce je rozdělena do dvou částí. První část obsahuje teoretcká východska práce, které jsou důležté pro správné pochopení a zpracování dat. Jsou zde zpracována témata týkající se analýzy časových řad a konstrukce a analýzy regulačních dagramů. Druhá část je tvořena oddíly zabývající se analýzou získaných dat. Jednotlvé podkaptoly tvoří soustavu na sebe navazujících kroků, které celkově vytvářejí metodcký postup analýzy. V závěru je popsána drobná aplkace, která je součástí této práce a která může sloužt jako pomůcka pro provozní č majtele podnků. 1.2. Cíl práce Cílem této dplomové práce je ukázka využtí statstckých metod pro pops vývoje ekonomckých procesů v podnku. Dále pak zpracování ekonomckých dat a jejch analýza pomocí regulačních dagramů a časových řad. Dalším cílem je vytvoření metodckého návodu, jakým provozovatelé podnku mohou statstcké metody používat př analýze dat v prax. 11
2. Časové řady Pro pops statstckých dat nejen ekonomckých jevů v čase se využívá časových řad. Využtí časových řad umožňuje provádět kvanttatvní analýzu daných dat a následné prognózování možného vývoje těchto jevů v budoucnost. Tato kaptola je zaměřena na jejch defnc, pops charakterstk a metod využívaných př prognózování budoucího vývoje. 2.1. Vymezení základních pojmů Časovou řadou se rozumí posloupnost hodnot určtého statstckého znaku (ukazatele) uspořádaných z hledska času ve směru od mnulost k přítomnost. Ukazatel musí být věcně a prostorově shodně vymezen po celé sledované období. Jednotlvé typy časových řad se rozlšují dentfkací rozdílností sledovaných ukazatelů a jejch specfckým statstckým vlastnostm. Pro tuto prác je stěžejním krtérem čas a dle tohoto hledska můžeme rozčlent časové řady na tyto dva typy. Prvním z nch jsou časové řady okamžkové, jejchž hodnota ukazatele se plynule mění v čase. Tato řada tedy udává stav ukazatele v určtých okamžcích. Hodnoty stavu nemusí přímo závset na délkách ntervalu mez odečty, př delším ntervalu však může pochoptelně dojít k větší změně. Sčítání hodnot ukazatele tohoto typu řady nemá smysl a tedy an reálnou nterpretac. Druhou skupnu tvoří časové řady ntervalové. Hodnoty ukazatele sledují vznk nebo zánk (udávají přírůstek č úbytek) za časový nterval, hodnoty tedy závsejí na délkách ntervalů. Z tohoto důvody by měly být sledované ntervaly stejně dlouhé, neboť v opačném případě by mohlo dojít ke zkreslení. Například budeme-l chtít sledovat měsíční tržby podnku, budou tyto hodnoty nesrovnatelné, neboť každý měsíc má jný počet dní a jný počet pracovních dní. Tyto nesrovnatelnost jsou řešeny tzv. kalendářním očšťováním, které spočívá v přepočtu sledovaného ntervalu na jednotkový nterval. Lze jej vyjádřt vztahem 1.1. 12
y = 0 t y t k k t t (1.1) 0 y t očštěná hodnota y t hodnota očšťovaného ukazatele k t počet kalendářních dní ve sledovaném měsíc k t pevný časový nterval, například 30 dní Hodnotu ukazatele za delší nterval lze získat sčítáním hodnot za dílčí část tohoto ntervalu. Sčítání hodnot ukazatele tohoto typu časové řady má smysl a lze jej nterpretovat. 2.2. Charakterstky časových řad Hodnoty časové řady budu označovat symbolem y, kde představuje hodnoty časového ntervalu t. y tedy značí napozorovanou hodnotu časové řady v časovém bodě. Celou množnu hodnot časové řady až do časového bodu potom značíme y 1, y 2,, y t-1, y t. Budu předpokládat, že hodnoty y jsou kladné a nabývají hodnot = 1, 2,, n a ntervaly mez jednotlvým sousedním okamžky jsou stejně dlouhé. Př výpočtu průměru okamžkové řady se započítává průměrná hodnota ukazatele na daném úseku. Je označován symbolem y a pokud jsou vzdálenost mez jednotlvým časovým úseky shodné, nazývá se chronologcký průměr prostý. Lze jej vypočítat takto: n 1 y = + 1 y n 1 2 = 1 2 y + yn 2 (1.2) Průměr ntervalové řady, taktéž označovaný y, je dán vztahem pro artmetcký průměr hodnot dané časové řady v jednotlvých ntervalech. y = 1 n n y = 1 (1.3) 13
Časové řady můžeme popsat pomocí absolutních a relatvních ukazatelů. Absolutní ukazatele pracují s rozdíly hodnot. Patří sem absolutní přírůstky (první dference), které lze vypočíst jako rozdíl dvou po sobě jdoucích hodnot v časové řadě. Značí se ( ) a vyjadřují, o kolk se změnla hodnota ukazatele oprot předcházejícímu období. 1d y ( y) y y, 1 d = 1 = 2, 3,...,n (1.4.) Pokud jsou absolutní přírůstky řady v podstatě konstantní (kolísají nahodle kolem průměru), řada se mění lneárně a tento jev nazýváme lneární trend. Z jednotlvých absolutních přírůstků lze vypočítat průměr prvních dferencí, značený d( ), vyjadřuje průměrnou změnu časové řady za jednotkový časový nterval. 1 y jenž 1 d ( y) yn y = n 1 1 (1.5) Relatvní ukazatele pracují s poměry hodnot. Umožňují nám určt dynamku časové řady, tj. zda vývojový trend zrychluje, zpomaluje č udržuje stálé tempo. K tomu využíváme koefcentů růstu, označovaných sobě jdoucích hodnot časové řady. Je dán tímto vztahem: k ( y), k (y), které vypočítáme jako poměr dvou po y = = 2, 3,...,n y (1.6) 1 Koefcent růstu bývá také nazýván řetězový, neboť se jeho jmenovatel postupně (řetězově) mění. Vyjadřuje nám, kolkrát se za daný okamžk změnla hodnota časové řady oprot mnulému období. Kolísají-l tyto koefcenty kolem konstanty, můžeme říc, že trend dané časové řady je exponencální. Průměrný koefcent růstu k(y) pak vyjadřuje průměrnou změnu koefcentů růstu během jednotkového časového ntervalu. Lze jej vypočíst jako geometrcký průměr těchto hodnot: k ( y) = n 1 y y n 1 (1.7) Jelkož průměr prvních dferencí a průměr koefcentů růstu závsí pouze na prvním a posledním členu časové řady, lze tyto charakterstky s úspěchem použít pouze 14
u časových řad, jejchž vývoj je nějakým způsobem monotónní. V opačném případě nemají přílšnou vypovídající hodnotu. Cílem analýzy časových řad je určení trendu procesu a následná konstrukce matematckého modelu. Sestrojení odpovídajícího modelu nám umožňuje správně dentfkovat mechanzmus, jehož působením vznká daná časová řada, podmínky nezbytné pro její vznk, a pochopt vzájemné vazby, jež se na vznku časové řady podílejí. Na základě změn těchto jednotlvých podmínek lze smulovat a následně predkovat budoucí vývoj. 2.3. Dekompozce časové řady Ve své prác budu provádět analýzu pomocí dekompozční metody. Dekompozce s klade za cíl snáze dentfkovat pravdelné chování rozložené časové řady, dentfkovat a vysvětlt systematcké část řady. Tato metoda vychází z předpokladu, že každá časová řada se dá rozložt na čtyř složky: Trendovou (T ) Sezónní (S ) Cyklckou (C ) Náhodnou (ε ) Trendová složka zachycuje dlouhodobé změny v chování časové řady - zachycuje tedy dlouhodobý růst č dlouhodobý pokles. Trend (jak se většnou zkráceně trendová složka nazývá) vznká důsledkem působení sl, které působí stejným směrem. Trend lze většnou popsat matematckou funkcí v celé délce časové řady. Př popsu trendu tedy nejde o to, zda časová řada krátkodobě klesá č roste, ale jde skutečně o zachycení tendence pohybu časové řady. Pokud ukazatel časové řady během celého pozorovaného období kolísá kolem jedné hodnoty, mluvíme o časové řadě bez trendu. Sezónní složka popsuje perodcké změny v časové řadě, které se odehrávají v rámc jednoho kalendářního roku a každý rok se opakují. V podstatě by se dalo říc, že sezónnost je důsledkem střídání ročních období. Nejčastěj pozorujeme sezónnost 15
u čtvrtletních a měsíčních časových řad, proto jsou tato měření pro zkoumání sezónní složky nejvhodnější. Přestože se tato složka pravdelně v časové řadě opakuje, může v průběhu let měnt svůj charakter. Cyklcká složka popsuje dlouhodobé fluktuace kolem trendu. Zachycuje tedy dlouhodobou fáz poklesu č růstu, která je mnohem větší než jeden rok. U ekonomckých řad je cyklcká složka často spojována se střídáním hospodářských cyklů. Protože působí dlouhodobě, je velm obtížné j vysledovat a popsat. Peroda cyklcké složky se může pohybovat v násobcích let a proto pokud máme krátkou časovou řadu, nemusí být cyklcká složka vůbec rozeznatelná. Taktéž její příčny nemusí pocházet přímo z ekonomcké oblast. Navíc se charakter této složky může v čase měnt. Náhodná složka. Zatímco první tř složky časové řady patří mez systematcké, náhodná složka je složka nesystematcká a je tvořena náhodným výkyvy časové řady. Pod tuto složku můžeme zařadt všechny vlvy, které na časovou řadu působí a které nedokážeme systematcky podchytt a popsat. Zbývá nám v časové řadě po odstranění všech předchozích složek. Pro náhodnou složku se zavádějí následující předpoklady: 1. E(ε ) = 0 pro každé =1,2,,n Střední hodnota náhodné složky je nulová. Tato podmínka znamená, že náhodná složka nepůsobí systematckým způsobem na hodnoty časové řady y. 2. E(ε ) = σ 2 pro každé =1,2,,n Rozptyl náhodné složky je konstantní. Tato podmínka vyjadřuje, že varablta náhodné složky nezávsí na hodnotách systematckých složek a je rovna neznámé kladné konstantě. 3. ε mají normální rozdělení pro každé =1,2,,n. Pokud náhodná složka splňuje všechny výše uvedené požadavky, hovoříme o ní jako o bílém šumu. 16
Vlastní dekompozc můžeme provést dvěma způsoby, pomocí adtvního a multplkatvního modelu. V adtvním modelu se jednotlvé složky sčítají, jsou uvažovány ve svých skutečných napozorovaných hodnotách a jsou měřeny v jednotkách řady y. Používá se v případě, že varablta hodnot časové řady je v čase přblžně konstantní. Hodnoty časové řady lze vyjádřt ve tvaru : y = T + C + S + ε (1.8) V multplkatvním modelu se jednotlvé složky mez sebou násobí. Ve své skutečně napozorované hodnotě je uvažována pouze trendová složka, ostatní složky se většnou uvádějí v relatvních hodnotách vůč trendu a jsou tedy bezrozměrné. Tento způsob dekompozce se používá v případě, že varablta řady roste v čase, nebo se v čase mění. Záps časové řady se provádí dle tohoto vzorce: y = T C S ε (1.9) 2.4. Vyhlazení časové řady Pro zkoumání dlouhodobého vývoje časové řady je nezbytné nejprve odstrant nežádoucí vlvy, jež se v časových řadách objevují a způsobují nezřetelnost vývojové tendence. Chceme-l určt trend, je třeba odstrant perodcké a nahodlé kolísání. Vyhlazení časové řady lze provést dvěma způsoby: Klasckým matematckým (analytckým) metody, například pomocí regresní analýzy Adaptvním postupy, které dokážou reagovat na změny v charakteru trendu, mez něž patří metoda klouzavých průměrů a metoda exponencálního vyrovnání Metoda regresní analýzy má oprot metodě klouzavých průměrů několk výhod. První z nch je možnost vyrovnání všech pozorovaných dat řady včetně prvků na počátku na konc a také to, že vhodně zvolenou trendovou funkc můžeme použít pro následnou predkc budoucího vývoje. Úkolem regresní analýzy je pro zadaná data x, 17
= 1, 2,, n, zvolt co nejvhodnější funkc a odhadnout její koefcenty tak, aby vyrovnání hodnot y touto funkcí bylo co nejoptmálnější. Př výběru vhodné matematcké funkce nejčastěj vycházíme z grafckého vyjádření časové řady. V této prác budu dále pracovat s lneárním typem trendu. Lneární trend je nejčastěj používaným typem trendové funkce. Absolutní přírůstky zde náhodně kolísají kolem konstanty. Regresní funkc η ( x) zde vyjadřujeme přímkou, pro kterou platí: ( ) β 1 β x η = + (1.10) x 2 Parametry β 1 a β 2 nazýváme regresní koefcenty. Odhady těchto koefcentů pro zadané dvojce (x, y ) se značí b 1 a b 2 a pro jejch určení se využívá metody nejmenších čtverců. Jejím aplkováním dostaneme pro odhady regresních koefcentů b 1 a b 2 tyto vzorce: n = 1 b2 = n (1.11) 2 2 x nx = 1 x y nx y b1 = y b2 x (1.12) x a y jsou výběrové průměry, které lze vyčíslt dle vzorců 1.15 a 1.3: 1 x= n n = 1 x (1.13) Označíme-l pak odhad regresní přímky ηˆ ( x), její rovnce pak vypadá takto: ( ) = b b x ˆ η + x 1 2 (1.14) 18
2.5. Modelace sezónní složky Př analýze časových řad se často setkáme s exstencí sezónních vlvů, které jsou v modelu časové řady vyjádřeny sezónní složkou. Ta představuje různé příčny, které se pravdelně každý rok opakují a ovlvňují tak hodnoty dané řady. Jejch výsledkem jsou pravdelně střídající se výkyvy hodnot vůč běžnému vývoj řady v průběhu let. Budeme-l vycházet ze vzorce (1.8) a budeme-l se zabývat pouze složkam ovlvňující řadu v době kratší než jeden rok, můžeme časovou řadu vyjádřt tímto vzorcem: y = T + S + ε = 1,2,... n (1.15) Průběh časové řady lze rozdělt do M perod, jež jsou součástí N období v každé perodě. Sledovaný časový úsek nese označení t j kde = 1,2,... N, j= 1,2,... M. Hodnoty časové proměnné pak určíme vztahem (1.16). ( j ) t j = 4 1 + (1.16) Má-l časová řada lneární trend, lze sezónní výkyvy vyjádřt předpsem: j = β1 + β 2tj ν (1.17) η + kde η j představuje vyrovnanou hodnotu v -tém období j-té perody tj je časová proměnná -tého období j-té perody ν značí sezónní výkyv -té perody a budeme předpokládat jeho omezení dané vztahem: n ν = 1 = 0 (1.18) Pro odhady regresních koefcentů β 1, β 2 a ν značených b 1, b 2 a v využjeme taktéž metodu nejmenších čtverců. Nejprve je nutné zavést pomocnou proměnnou c, která se využívá pouze pro zjednodušení výpočtu. ν = c b 1 (1.19) 19
S využtím vzorce (1.18) lze odhad regresního koefcentu b 1 popsat takto: b 1 = 1 n n c = 1 (1.20) Odhad koefcentu b 2 a hodnoty pomocné proměnné c lze vypočíst z této soustavy rovnc: cm+ b m t 2 j j= 1 = m j= 1 y j (1.21) n m n m n m 2 c tj + b2 tj = yjtj = 1 j= 1 = 1 j= 1 = 1 j= 1 (1.22) Postup př vyšetření sezónní složky je pak následující: nejprve ze soustavy rovnc dané vzorc 1.21 a 1.22 vypočítáme hodnoty c a odhad regresního koefcentu b 2 vyčíslíme odhad regresního koefcentu b 1 dosazením vypočtených hodnot do vzorce 1.20 určíme sezónní výkyvy dle vzorce 1.19 20
3. Regulační dagramy Regulační dagramy se využívají ke grafckému znázornění jakéhokolv procesu v čase a jeho následné analýze. Je základním grafckým nástrojem, jenž nám umožňuje rozlšt varabltu procesu vznklou náhodným a vymeztelným příčnam. Náhodné příčny vytvářejí celý soubor jednotlvě nedentfkovatelných příčn, z nchž každá má na celkovou varabltu jen velm malý vlv. Ncméně součet jejch vlvů je měřtelný a je považován za přrozený rys procesu. Jejch působení na proces je trvalé a tedy relatvně předvídatelné. Vyvolávají-l varabltu procesu pouze tyto příčny, lze jej označt za proces ve statstcky zvládnutém stavu. Vymeztelné příčny nejsou běžnou součástí procesu a začnou-l na proces působt, je třeba je co nejrychlej odstrant. Můžeme je rozdělt na příčny nepředvídatelné, které nemůžeme popsat statstckým zákontostm. Tyto příčny vedou k reálné změně procesu, jsou dentfkovatelné a obvykle odstrantelné. A na příčny předvídatelné, jejchž působení lze popsat fyzkálním zákony. Jsou dány fyzkální podstatou procesu, jsou omeztelné, ale ne zcela odstrantelné. Působí-l na proces tyto vymeztelné příčny, projeví se to nepřrozeným kolísáním údajů, pomocí nchž varabltu hodnotíme. Proces není reprodukovatelný a není považován an za proces ve statstcky zvládnutém stavu. 3.1. Vymezení základních pojmů Základním stavebním kamenem statstcké regulace je regulační dagram. Vodorovná osa tohoto grafu představuje čas, svslá pak sledovanou charakterstku daného procesu, kterou použjeme jako testovací krtérum stablty procesu. Získané hodnoty se pak do tohoto grafu nanášejí jako body regulované velčny v daných podskupnách. Rozhodnutí o statstcké zvládnutelnost procesu závsí na třech základních čárách rovnoběžných s časovou osou vymezující její rozsah. CL se nazývá střední přímka a představuje požadovanou hodnotu sledované charakterstky. Defnovat j můžeme jako nomnální hodnotu (například danou 21
technckým předpsem), jako hodnotu založenou na mnulé zkušenost ve výrobním procesu nebo jako odhad z hodnot regulované velčny. UCL a LCL se nazývají horní regulační mez a dolní regulační mez a jsou rozhodující pro zjštění statstcké zvládnutelnost procesu, říká se jm také akční meze. Tyto dvě čáry představují pásmo, ve kterém působí pouze náhodné příčny varablty procesu, a využívají se př rozhodování, zda učnt zásah do daného procesu č nkolv. Šíře tohoto pásma (tedy ctlvost dagramu) je obvykle ve velkost ± 3σ. Interpretace regulačního dagramu je pak následující: Leží-l všechny body regulačního dagramu uvntř akčních mezí, je proces pokládán za statstcky zvládnutý a není třeba žádného zásahu. Leží-l některý bod mmo akční meze, je proces pokládán za statstcky nezvládnutý a je třeba dentfkovat příčny této odchylky a elmnovat je. Pro lepší kontrolu procesu lze zavést ještě další meze nazývané výstražné meze značené UWL (horní výstražná mez) a LWL (dolní výstražná mez), které tvoří pásmu vždy užší než pásmo akčních mezí. Jejch vzdálenost od střední přímky je ± 2σ. Využjeme-l je, je mohou nastat ještě tyto případy: Leží-l některé body uvntř výstražných mezí, je proces pokládán za statstcky zvládnutý a není třeba žádného zásahu. Leží-l některý bod uvntř pásma vyznačeného mez UWL a UCL, nebo LWL a LCL, je proces nadále považován za statstcky zvládnutý. Leží-l však dva a více bodů za sebou v těchto mezích, jde o sgnál, že na proces s velkou pravděpodobností působí vymeztelná příčna a bude nutné vykonat regulační zásah do procesu. 3.2. Shewartovy regulační dagramy Tyto regulační dagramy byly specálně vyvnuty pro sledování jednoho konkrétního znaku. Základním předpokladem pro jejch užtí je získání dostatečného počtu výběrů za relatvně stálých podmínek realzace procesu. Př testování aktuální hodnoty není 22
brána v potaz mnulá hodnota, řadí se proto do skupny regulačních dagramů bez pamět. Analýza dagramů pak spočívá v posouzení, zda průběh charakterstk sledovaného znaku nesgnalzuje působení vymeztelných příčn varablty. Za sgnály působení varablních příčn se považuje výskyt bodů ležících mmo regulačních mezí a nenáhodná seskupení bodů. Dle charakteru regulované velčny je můžeme rozdělt do dvou skupn: regulační dagramy pro regulac měřením Tento typ dagramů se používá pro sledování velčny, jejíž znaky č techncké parametry jsou měřtelné. Aby samotná aplkace dagramů byla správná, je nutné ověřt tyto předpoklady: 1. regulovaná velčna musí mít normální rozdělení 2. střední hodnota procesu musí být konstantní 3. směrodatná odchylka procesu musí být konstantní 4. naměřené hodnoty jsou na sobě nezávslé Cílem statstcké regulace je v tomto případě udržení procesu ve stavu, kdy je střední hodnota směrodatná odchylka stablní, tedy aby byly v souladu s požadovaným hodnotam. Pro tyto účely se používají regulační dagramy ( ) x R kl,,, ( x, R) a ( s) x,. regulační dagramy pro regulac srovnáváním Př sledování počtu neshodných produktů č neshod na těchto produktech, tedy kdy pracujeme s dskrétní náhodnou proměnnou, se používají regulační dagramy pro regulac srovnáváním. Jejch výběr závsí na tom, zda pracujeme s počty neshod regulační dagramy u a c, č počtem neshodných jednotek ve výběru regulační dagramy p a np. Systém výběru správného regulačního dagramu je zobrazen na obrázku č.1. 23
f x ¾ f f ¾,z x - z x f ¾f z h ¾q h n - ¾ x - ¾ ¾ ¾f z ¾ f ¾f z ¾ f - - ½ ½ n Obr. 1 - Rozhodovací strom pro výběr Shewartova regulačního dagramu 3.3. Regulační dagramy R ) (x, kl, V této dplomové prác budeme používat právě tuto dvojc regulačních dagramů. V každé logcké podskupně je provedeno právě jedno měření regulované velčny, neboť se používají v případech, kdy ekonomcké č technologcké podmínky neumožňují realzovat výběry rozsahu většího než n = 1. Regulační dagram pro ndvduální hodnoty x je velce ctlvý na odchylky rozdělení regulované velčny a proto se doporučuje provádět test normalty jeho rozdělení. Protože se v těchto dagramech zjšťuje jen jedna hodnota x, využívá se tzv. klouzavého rozpětí, což je hodnota měřeného znaku v -té podskupně. 24
Regulační dagram pro klouzavé rozpětí R kl V tomto regulačním dagramu jsou zachyceny hodnoty klouzavého rozpětí R kl,, které vypočteme dle vztahu: R, = 2,3,... k. (2.1) kl, = x x 1 Střední přímka a akční meze se stanoví následovně: CL= R = 1 kl R kl, k 1 = 2 k (2.2) UCL= D4 R kl = 3, 267 R kl (2.3) LCL = kl D3 R = 0 kde součntele D 4 a D 3 lze nalézt v Tabulce součntelů pro n = 2 v příloze. (2.4) Regulační dagram pro ndvduální hodnoty x Do tohoto regulačního dagramu se naměřené hodnoty zaznamenávají přímo, proto střední přímka je dána vzorcem: 1 CL= x= k k = 1 x (2.5) Pro určení akčních mezí potřebujeme nejprve stanovt odhad směrodatné odchylky ze vztahu R ˆ σ = kl d 2 (2.6) kde d 2 = 1,128 je Hartleyova konstanta, kterou lze nalézt v Tabulce součntelů příloze. Hodnoty akčních mezí pak lze vypočítat takto: UCL= CL+ u ˆ = x+ 2, 66 0,99865 σ R kl (2.7) LCL= CL u ˆ = x 2, 66 0,99865 σ R kl (2.8) kde u 0,99865 = 3 je kvantl normovaného normálního rozdělení a jeho hodnotu lze nalézt v příloze. 25
3.4. Testy nenáhodných seskupení Testy nenáhodných seskupení umožňují jným způsoben detekovat poruchy a změny v procesu, které se neprojevují překročením regulačních mezí. Norma ČSN ISO 8258 popsuje 8 základních typů, v každém zde uvedeném případě je nutné hledat přřadtelné příčny, případně nějakým způsobem zasáhnout do procesu. Pravdlo 1. Jedna hodnota je mmo regulační meze Jedná se o lokální poruchu procesu, chybné měření, výpadek. Mohou být chybně stanovené regulační meze, malá varablta uvntř podskupny př konstrukc dagramu. Opakuje-l se na téže straně, může jít o posunutí střední hodnoty nebo o asymetrcké rozdělení dat. Opakuje-l se na obou stranách, může jít o zvýšení nestablty nebo rozptylu dat. Pravdlo 2. 9 hodnot je na téže straně od centrální lne Pravděpodobné posunutí střední hodnoty, snížení varablty mez podskupnam, asymetre dat, přílš šroké nebo neodpovídající regulační meze. Pravdlo 3. 6 hodnot monotónně roste č klesá Autokorelovaný proces, závslá měření. Lneární trend, způsobený opotřebením nebo výpadkem. Přílš šroké regulační meze. Pravdlo 4. 14 alternujících hodnot (pravdelně kolísají nahoru a dolů) Přeregulovaný nebo nestablní proces. Autokorelovaná měření. Může také jít o vymyšlená čísla. Pravdlo 5. 2 ze 3 hodnot je mmo nterval ±2s. Varování před možným překročením regulačních mezí. Pravdlo 6. 4 z 5 hodnot mmo nterval ±s na téže straně centrální lne. Pravděpodobné posunutí střední hodnoty. Varování před možným překročením regulačních mezí. 26
Pravdlo 7. 15 hodnot je uvntř ntervalu ±s Snížení varablty mez podskupnam. Př opakování uvažovat o nových regulačních mezích. Nesprávná volba regulačních mezí. Podvádění operátorem, vymyšlená čísla. Pravdlo 8. 8 hodnot je mmo nterval ±s na obou stranách centrální lne Zvýšení varablty mez podskupnam. Varování před překročením regulačních mezí. Porucha procesu. 27
Obr.2 Testy nenáhodných seskupení dle normy ČSN ISO 8258 28
3.5. Kolmogorov-Smrnovův test Kolmogorov-Smrnovův test se používá k testování hypotézy o tvaru rozdělení náhodné velčny pro její jednotlvé naměřené velčny. Jeho výhodou je, že jej lze použít pro relatvně malý datový výběr. Pro pops daného rozdělení se využívá dstrbuční funkce normálního rozdělení F(x). Tato dstrbuční funkce se nazývá teoretcká a slouží k testu nulové hypotézy. Nulová hypotéza vychází z předpokladu, že rozdíly mez emprckou a teoretckou dstrbuční funkcí jsou statstcky nevýznamné. Alternatvní hypotéza H 1 přepokládá opak. hypotéza H 0 : rozdělení velčny je dáno dstrbuční funkcí F(x) hypotéza H 1 : rozdělení velčny je dáno jnou dstrbuční funkcí než F(x) Př testu pak postupujeme tak, že určíme tzv. emprckou dstrbuční funkc, jež nám slouží jako odhad dstrbuční funkce sledované velčny. Pracujeme s hodnotam statstckého souboru, máme je však uspořádány dle velkost od nejmenšího po největší. Emprckou dstrbuční funkc pak můžeme defnovat jako: F n 0 ( x) = n 1 pro x < x (1) pro x (1) x < x (n-1) pro x x (n) = 1,,n-1 (3.1) V dalším kroku porovnáme hodnoty obou dstrbučních funkcí a je-l maxmální rozdíl těchto dvou funkcí přílš velký, nulovou hypotézu zamítáme. Přesněj řečeno zamítáme hypotézu H 0, pokud sup x F e ( x) F( x) > D α ( n) (3.2) kde D α (n) je krtcká hodnota testované statstky. Krtcké hodnoty pro hladnu významnost α = 0,05 lze nalézt v příloze. 29
4. Aplkace v prax Použtí statstckých metod má rozhodně svůj význam nejen v oblast řízení jakost, ale ve všech, kde je nutné č žádoucí procesy analyzovat, zjšťovat jejch správnost, zjšťovat důvody proč a jak k výsledným hodnotám došlo a v neposlední řadě také predkovat jejch budoucí vývoj. Z tohoto důvodu jsem se rozhodla aplkovat statstcké metody na vývoj tržeb podnku. 4.1. Pops podnku Základní údaje o podnku IČO 00543136 Obchodní frma Vysokoškolský klub Terč o.s. Sídlo Kolejní 2905/2, 61200 Brno - Královo Pole Právní forma podnkání 701 - Sdružení Typ subjektu právncká osoba tuzemská Zahájení čnnost 3.2.1997 Žvnost Hostnská čnnost druh žvnost: Ohlašovací řemeslná vznk oprávnění: 3.2.1997 zahájení čnnost: 3.2.1997 Výroba, obchod a služby neuvedené v přílohách 1 až 3 žvnostenského zákona obory čnnost: Mmoškolní výchova a vzdělávání, pořádání kurzů, školení, včetně lektorské čnnost. Provozování kulturních, kulturně-vzdělávacích a zábavních zařízení, pořádání kulturních produkcí, zábav, výstav, veletrhů, přehlídek, prodejních a obdobných akcí. 30
Provozování tělovýchovných a sportovních zařízení a organzování sportovní čnnost. druh žvnost: Ohlašovací volná vznk oprávnění: 31.3.1999 zahájení čnnost: 31.3.1999 Hlavní čnnost klubu sdružování studentů všeljakých zájmů provozování baru organzování her pro studenty pořádání koncertů, plesů, exkurzí a zájezdů poskytování klubových prostor (školení táborových nstruktorů, ) sponzorování (táboru zdravotně postžených dětí, soutěží, plesů) Organzační struktura Klub během mnulých let prošel mnoha reorganzacem, v současné době má 23 aktvních členů, z jejchž řad jsou začátkem každého zmního semestru na členské schůz volen tto funkconář: předseda hospodář dva správc baru organzátor kulturních akcí Funkce jsou lbovolně slučtelné, pouze v případě, že dojde ke sloučení funkce hospodáře a předsedy, je volen ještě statutární zástupce, jehož funkcí je pouze zastupování předsedy v jeho nepřítomnost. Nejvyšším orgánem klubu je členská schůze. 31
4.2. Analýza týdenních tržeb Z hledska sledování vývoje tržeb v jednotlvých dílčích obdobích roku je vhodné pokust se analyzovat tržby v krátkých časových úsecích. Za právě takový časový úsek jsem zvolla jeden kalendářní týden. Pro sledování stejnoměrnost daných hodnot je vhodné využít regulační dagramy. Nevhodnějším typem pro daný soubor hodnot je regulační dagram klouzavého rozpětí. Analýzu jsem provedla na týdenních tržbách z roku 2008, obsahující hodnoty tržeb v týdnech 1. 26. a 39. 51. Kalendářní týdny v letních měsících 27. až 38. nebudu uvažovat, neboť podnk je přes tuto dobu uzavřen a jejch hodnoty by mohly zkreslt výsledná data. Týden Tržba Týden Tržba Týden Tržba 113 961 39 158 305 15 97 282 40 143 359 112 237 41 158 164 129 121 42 209 256 130 121 43 155 209 121 298 44 161 178 127 439 45 172 750 84 224 46 136 151 47 99 287 108 327 48 154 248 199 856 49 146 880 166 065 50 115 255 102 364 51 107 609 Tab.1 Týdenní hodnoty tržeb v roce 2008 32
@ f Graf 1 Týdenní hodnoty tržeb v roce 2008 4.2.1. Subjektvní posouzení Podíváme-l se na předchozí graf, můžeme z něj vyčíst několk nformací. První z nch je, že data vykazují mírně rostoucí trend. Pokud tento fakt ověříme, bude nutné jej před samotnou analýzou dat odstrant. Další věc, které s můžeme všmnout, je několk významných výkyvů tržeb v průběhu roku. Jedná se především o 1., 24. a 30. hodnotu. Tyto hodnoty bude jstě zajímavé prozkoumat a zjstt, zda se nejedná o anomále v daném procesu a jejch příčny. 4.2.2. Určení základních charakterstk Prvním krokem analýzy dat je určení jeho základních charakterstk, neboť právě ony nám dávají prvotní představu o jejím průběhu. Výběrový průměr Výběrový průměr vyjadřuje, kolem které hodnoty daného souboru dat osclují. Pro jeho výpočet použjeme vzorec (1.3): 33
n 1 y= y n =1 = 130776 Znamená to tedy, že hodnoty týdenních tržeb osclují kolem hodnoty 130 776,- Kč. Kč Výběrová směrodatná odchylka Výběrová směrodatná odchylka charakterzuje rozptýlení hodnot kolem střední hodnoty. Lze jí vypočíst pomocí tohoto vztahu: n 1 s= n 1 = 1 2 ( x x) 32903 Kč 2 = Hodnota výběrové směrodatné odchylky je 32 903,- Kč. Absolutní přírůstky Výše absolutních přírůstků nám udává, o kolk se průměrně změnla hodnota dané časové řady za jednotkový časový nterval. Výpočet hodnot absolutních přírůstků lze provést pomocí vzorce (1.4). ( y) y y, 1 d = 1 = 2, 3,...,n @ f f ¾ ½ ¾ Graf 2 Graf absolutních přírůstků týdenních tržeb 34
Ze sestaveného grafu je zřejmé, že absolutní přírůstky náhodně kolísají kolem konstanty. Lze tedy předpokládat, že časová řada má lneární trend, který můžeme v dalších krocích analýzy popsat. y d_1 1 51 313 ------- 2 126 242 74 929 3 121 145-5 097 4 96 221-24 924 5 95 852-369 6 94 616-1 237 7 169 553 74 938 8 166 011-3 543 9 131 570-34 441 10 148 923 17 353 11 141 516-7 407 12 125 478-16 038 13 79 940-45 538 14 113 961 34 022 15 97 282-16 679 16 112 237 14 956 17 129 121 16 883 18 130 121 1 000 19 121 298-8 823 20 127 439 6 141 21 84 224-43 215 22 141 946 57 722 23 108 327-33 619 24 199 856 91 529 25 166 065-33 791 26 102 364-63 701 27 158 305 55 941 28 143 359-14 945 29 158 164 14 804 30 209 256 51 092 31 155 209-54 047 32 161 178 5 969 33 172 750 11 572 34 136 151-36 599 35 99 287-36 864 36 154 248 54 960 37 146 880-7 367 38 115 255-31 625 39 107 609-7 646 Tab. 2 Tabulka hodnot absolutních přírůstků týdenních tržeb 35
4.2.3. Test statstcké významnost regresního koefcentu b 2 Předpoklady pro použtí regulačních dagramů jsou takové, že sledovaná data musí být navzájem nezávslá, nesmí tedy vykazovat an rostoucí an klesající trend. Pokud by tomu tak bylo, výsledek analýzy by byl pro reálné využtí nepoužtelný. Je-l zaznamenán trend u dat získaných z nějakého výrobního procesu, jedná se vždy o jev nežádoucí, neboť by to znamenalo vytváření stále větších odchylek a v konečném důsledku zmetků ve výrobě. Je-l však zaznamenán trend u dat získaných z ekonomcké čnnost, lze jej považovat jak za jev žádoucí tak nežádoucí. Například rostoucí trend je žádoucí u tržeb, nežádoucí však u nákladů. Předpoklad Data, která zde budu analyzovat, představují týdenní tržby za rok 2008. Předpokládejme, že jsou závslá pouze na počtu zákazníků, kteří ten daný týden přjdou do podnku, a nejsou závslá na čase, tedy že data nevykazují žádný trend. Naopak ze subjektvního posouzení grafu tržeb se zdá, že data mají rostoucí trend. Tento jev tedy budeme nyní testovat. Testování K provedení samotného testu je třeba nejprve vyrovnat zadané hodnoty regresní přímkou a spočítat odhady regresních koefcentů. Pro vyrovnání hodnoty využjeme vzorce (1.11) a (1.12): b n x y nxy = 1 2 = = n 2 2 x nx = 1 b y b x= 110095 1 = 2 1034,04 Předps rovnce pro odhad regresní přímky pak vypadá takto: ηˆ ( x ) = 110095 + 1034,04* x 36
Vyrovnané hodnoty jsou uvedeny v tabulce 3 ve sloupc označeném yv a znázorněny v grafu 3. y yv e 1 51 313 111 129-59 816 2 126 242 112 163 14 079 3 121 145 113 197 7 948 4 96 221 114 232-18 010 5 95 852 115 266-19 413 6 94 616 116 300-21 684 7 169 553 117 334 52 220 8 166 011 118 368 47 643 9 131 570 119 402 12 168 10 148 923 120 436 28 487 11 141 516 121 470 20 046 12 125 478 122 504 2 974 13 79 940 123 538-43 598 14 113 961 124 572-10 611 15 97 282 125 606-28 324 16 112 237 126 640-14 403 17 129 121 127 674 1 447 18 130 121 128 708 1 413 19 121 298 129 742-8 444 20 127 439 130 776-3 337 21 84 224 131 810-47 586 22 141 946 132 844 9 102 23 108 327 133 878-25 552 24 199 856 134 912 64 943 25 166 065 135 946 30 118 26 102 364 136 980-34 617 27 158 305 138 014 20 290 28 143 359 139 048 4 311 29 158 164 140 083 18 081 30 209 256 141 117 68 139 31 155 209 142 151 13 058 32 161 178 143 185 17 993 33 172 750 144 219 28 531 34 136 151 145 253-9 102 35 99 287 146 287-47 000 36 154 248 147 321 6 927 37 146 880 148 355-1 475 38 115 255 149 389-34 134 39 107 609 150 423-42 814 Tab. 3 Tabulka vyrovnaných hodnot a rezduí týdenních tržeb 37
@ ¾ n q @ ff f f n f f n Graf 3 Graf zadaných hodnot a hodnot vyrovnaných regresní přímkou Zvolíme hypotézy: H 0 : b 2 = 0 Koefcent b 2 regresní přímky je roven nule, tedy data nemají žádný trend. H 1 : b 2 0 Koefcent b 2 regresní přímky je různý od nuly, tedy data vykazují trend. Hodnota testového krtéra je 2,335. Určíme obor krtckých hodnot pro hladnu významnost α = 0,05 W 0,05 = 2,026;2,026 Závěr Hodnota testového krtera je 2,335 a nepatří ho oboru oru krtckých hodnot 2,026;2,026 a tedy hypotézu H 0 zamítáme. Zamítl jsme hypotézu H 0, že je koefcent b 2 roven nule, tedy data že nemají žádný trend. Přjímáme hypotézu H 1, a tedy potvrzujeme náš původní předpoklad, že data vykazují lneární trend. Pro další vyhodnocování je třeba tento trend z dat odstrant. 38
4.2.4. Výpočet rezduí Rezdua představují odchylky sledovaných hodnot od hodnot vyrovnaných regresní přímkou. Jelkož jsme v předchozí kaptole zjstl, že sledovaná data vykazují rostoucí trend a my, abychom je mohl dále analyzovat pomocí regulačních dagramů, potřebujeme tento trend elmnovat, využjeme právě tyto rezdua pro odstranění trendu. e = y yv (4.1) e. rez y. pů y v vy zduum ůvodní hodnota yrovnaná hodnota Vypočtené hodnoty rezduí jsou uvedeny v tabulce 3 ve sloupc označeném e a znázorněny v grafu 4. @ ¾ n @ ff Graf 4 Graf rezduí týdenních tržeb Subjektvní posouzení grafu Rezdua náhodně kolísají kolem nuly a jejch rozptyl je konstantní. Předpokládáme tedy, že kolísání hodnot závsle proměnné kolem regresní přímky je dáno normálním rozdělením s nulovou střední hodnotou. 39
4.2.5. Test normálního rozdělení dat Jako u každého jného datového souboru je nezbytné před dalším pokračováním analýzy provést test normalty rozdělení dat, neboť v případě, že by data neměla normální rozdělení, nelze je použít k sestrojení regulačního dagramu. Došlo by k nedodržení jednoho ze základních předpokladů a výsledná analýza by neměla žádnou vypovídající hodnotu. Předpoklad Formulujeme hypotézu, že rezdua mají normální rozdělení Testování Pro ověřování ování normalty rezduí jsem využla test Kolmogorova-Smrnova. Je založený na porovnání teoretcké a emprcké dstrbuční funkce. Rozdíl mez nm je porovnáván s krtckým hodnotam a dle výsledku hypotéza o normaltě dat přjata č zamítnuta. f ½n xf n x ¾ q n Graf 5 Grafcký průběh teoretcké a emprcké funkce testu Kolmogorova-Smrnova rezduí týdenních tržeb Vypočtené hodnoty teoretcké a emprcké funkce jsou uvedeny v tabulce 4 a znázorněny v grafu 5. 40
Rezdua Četnost Empr. Teoretcká Hodnoty dstr. fukce dstr. funkce t f Fe F d -59 816 1 0,026 0,026 0,026-47 586 1 0,051 0,061 0,035-47 000 1 0,077 0,063 0,014-43 598 1 0,103 0,078 0,025-42 814 1 0,128 0,082 0,047-34 617 1 0,154 0,130 0,024-34 134 1 0,179 0,133 0,046-28 324 1 0,205 0,178 0,027-25 552 1 0,231 0,203 0,028-21 684 1 0,256 0,240 0,016-19 413 1 0,282 0,264 0,018-18 010 1 0,308 0,279 0,029-14 403 1 0,333 0,320 0,014-10 611 1 0,359 0,365 0,032-9 102 1 0,385 0,384 0,025-8 444 1 0,410 0,392 0,019-3 337 1 0,436 0,457 0,046-1 475 1 0,462 0,481 0,045 1 413 1 0,487 0,518 0,057 1 447 1 0,513 0,519 0,032 2 974 1 0,538 0,539 0,026 4 311 1 0,564 0,556 0,017 6 927 1 0,590 0,589 0,025 7 948 1 0,615 0,602 0,013 9 102 1 0,641 0,616 0,025 12 168 1 0,667 0,654 0,013 13 058 1 0,692 0,665 0,028 14 079 1 0,718 0,677 0,041 17 993 1 0,744 0,721 0,023 18 081 1 0,769 0,722 0,047 20 046 1 0,795 0,743 0,052 20 290 1 0,821 0,746 0,075 28 487 1 0,846 0,823 0,023 28 531 1 0,872 0,823 0,048 30 118 1 0,897 0,837 0,061 47 643 1 0,923 0,940 0,042 52 220 1 0,949 0,955 0,032 64 943 1 0,974 0,983 0,034 68 139 1 1,000 0,987 0,013 Tab. 4 Tabulka hodnot pro test Kolmogorova-Smrnova rezduí týdenních tržeb 41
Maxmální odchylka teoretcké a emprcké funkce 0,057 Krtcká hodnota 0,218 Závěr Výchozí hypotéza zněla, že soubor dat má normální rozdělení. Z grafu lze vypozorovat, že emprcká a teoretcká funkce se od sebe vzájemně přílš nelší. Maxmální hodnota odchylky mez dstrbučním funkcem je 0,057, což nepřekračuje krtckou hodnotu. Data tedy můžeme považovat za data s normálním rozdělením a můžeme je použít pro sestrojení regulačních dagramů. 4.2.6. Analýza rezduí pomocí regulačních dagramů Analýza dat pomocí regulačních dagramů spočívá ve vypočtení kontrolních mezí, zanesení napozorovaných hodnot do grafu společně s těmto mezem a následná nterpretace dagramů. Sestavení regulačního dagramu pro ndvduální hodnoty x Pro sestavení daného dagramu je potřeba nejprve vypočítat hodnoty kontrolních mezí a střední přímky. K jejch výpočtu použjeme vzorce (2.5), (2.7) a (2.8). CL = x = 0 Kč UCL= 78 232 Kč LCL=-78 232 Kč Zanesením jednotlvých hodnot rezduí a kontrolních mezí do grafu získáme regulační dagram. 42
fq f f ½ h @ ¾ n q D Graf 6 Regulační dagram ndvduálních hodnot rezduí týdenních tržeb Zhodnocení dagramu ndvduálních hodnot Z dagramu pro ndvduální hodnoty je patrné, že an jedna hodnota nevybočuje z mezí určených kontrolním mezem. Zajímavým se však jeví hodnoty 1., 7., 24. a 30. Příčnu neúměrně nízké tržby lze v prvním týdnu vysvětlt tím, že student bydlící na kolejích nedorazl hned po Vánočních svátcích. Proto byla tržba v prvním týdnu nízká, zato v druhém týdnu se s příjezdem studentů zvýšlo množství zákazníků, kteří podnk navštívl. Výkyv v sedmém týdnu byl způsoben přesně opačným jevem, než v předchozím případě. V sedmém týdnu totž končí zkouškové období na většně fakult a student (zákazníc) utrácejí v podnku více a mnohdy vícekrát v týdnu své peníze. Výkyv ve 24. týdnu lze opět vztáhnout na podmínky dané Vysokou školou, neboť v tomto týdnu probíhaly státní závěrečné zkoušky a důvod nárůstu tržeb je obdobný jako v předchozím případě. 43
30. hodnota představuje tržbu v 42. týdnu. Během 42. týdne byl proces ovlvněn plánovanou akcí, která přlákala velký počet zákazníků ků a způsobla následný výkyv v hodnotách. Konkrétně šlo o snížení ceny jednoho druhu alkoholu a to vyvolalo abnormálně vysokou poptávku po něm. A přes nžší prodejní cenu byla tržba podnku mnohonásobně vyšší, než obvykle. Sestavení regulačního dagramu pro klouzavá rozpětí Pro sestavení daného dagramu je potřeba nejprve vypočítat hodnoty kontrolních mezí a střední přímky. K jejch výpočtu použjeme vzorce (2.2), (2.3) a (2.4). CL= Rkl = 29 410 Kč UCL= 96 084 Kč LCL= 0 Kč fq f f ½ f h½z @ ¾ n q D Graf 7 Regulační dagram klouzavého rozpětí rezduí týdenních tržeb Zhodnocení dagramu klouzavého rozpětí rezduí Po prozkoumání dat zanesených do grafu pro klouzavé rozpětí můžeme zkonstatovat, že tento proces je z hledska varablty výběrů ve statstcky zvládnutém 44
stavu, neboť všechny hodnoty leží uvntř kontrolních mezí. Pokud bychom chtěl tento dagram rozebírat dále, ze statstckého hledska se jeví zajímavá hodnoty v bodech 2, 7 a 24. V těchto týdnech došlo k velm razantnímu nárůstu tržeb oprot okolním hodnotám. Vysvětlení těchto příčn je stejné jako v případě regulačního dagramu pro ndvduální hodnoty. Závěr Všechny hodnoty obou dagramů leží uvntř kontrolních mezí. Lze proto o sledovaných hodnotách prohlást, že jsou součástí statstcky zvládnutého procesu. Pokud bychom chtěl nadále sledovat vývoj tržeb v týdenních ntervalech, můžeme takto sestavené dagramy použít pro zachycení jejch dalšího vývoje. 4.3. Analýza měsíčních tržeb Z dlouhodobého hledska udržení se podnku v konkurenčním prostředí je vhodné analyzovat vývoj jeho tržeb během delšího časového ntervalu. Ideálním nástrojem pro rozbor dat v rámc několka období jsou časové řady. Samotná analýza spočívá ve zkoumání zákontostí vývoje ukazatele zobrazeného časovou řadou. Účelem zkoumání je nalezení všech podstatných pravdelností a dentfkace všech nepravdelností. Analýzu tržeb z hledska měsíčních ntervalů jsem zpracovala s daty za roky 2006, 2007 a 2008. Podobně jako v předcházející kaptole je nutné některá data vyřadt a některá zkorgovat tak, aby byla zachována jejch vypovídající hodnota. První úpravou, kterou je třeba provést, je přepočet hodnot tržeb na stejně dlouhý časový úsek. Tedy konkrétně jde o přepočet tržeb na měsíc, který má přesně 30 dní. Podstatné je to především pro měsíce červen a září, kdy podnk není v provozu po celou dobu. Podnk je uzavřen obvykle od posledního týdne v červnu do posledního týdne v září. Hodnoty za červenec a srpen jsou nulové a z hledska zachování vypovídající hodnoty datového souboru vyřazeny. Ostatní hodnoty jsou na 30-t denní nterval převedeny dle vzorce (4.2). 45
y y k = * 30 (4.2) n Kde y k představuje zkorgovanou hodnotu, y původní hodnotu a n je reálný počet dní za který tržba vznkla. Tabulka s přepočteným a vyřazeným hodnotam tržeb je pak následující: 2006 2007 2008 leden 378 668 372 416 444 102 únor 455 294 500 669 555 577 březen 409 637 505 556 511 555 duben 429 560 561 348 524 030 květen 597 708 519 850 498 878 červen 575 271 733 954 655 875 září 621 722 465 737 698 467 říjen 514 634 626 192 724 580 lstopad 520 043 508 724 589 633 prosnec 321 877 321 056 359 051 Tab. 5 Přepočtené hodnoty tržeb v létech 2006 2008 @ ¾ n q @ f z q h ¾ ½f ½ ¾ n z q h ¾ ½f ½ ¾ n z q h ¾ ½f ½ ¾ n Graf 8 Graf výše tržeb v létech 2006 2008 46
Vývoj měsíčních tržeb budeme analyzovat z pohledu časových řad. Časovou řadu, kterou tvoří, lze charakterzovat jako řadu ntervalovou, neboť se jedná o sumu tržeb získaných za nterval jednoho měsíce. 4.3.1. Subjektvní posouzení grafu Jedná se o ntervalovou časovou řadu představující hodnoty tržeb během tří po sobě jdoucích let. Dle pravdelných opakujících se výkyvů je jž na první pohled patrné, že časová řada obsahuje sezónní složku. Také se zdá, že z dlouhodobého hledska řada vykazuje mírně rostoucí trend. Tyto jevy budeme dále testovat. 4.3.2. Určení základních charakterstk časové řady Prvním krokem v analýze časové řady je určení jejích základních charakterstk, neboť právě ony nám dávají prvotní představu o jejím průběhu. Průměr ntervalové řady Pro jeho výpočet použjeme vzorec (1.3). Tento průměr vyjadřuje, kolem které hodnoty daného souboru dat osclují. y= 516722 Kč Absolutní přírůstky Výše absolutních přírůstků nám udává, o kolk se průměrně změnla hodnota dané časové řady za jednotkový časový nterval. Výpočet hodnot absolutních přírůstků lze provést pomocí vzorce (1.4). ( y) y y, 1 d = 1 = 2, 3,...,n Vypočtené hodnoty absolutních přírůstků jsou uvedeny v tabulce 6 ve sloupc označeném 1 d a znázorněny v grafu 9. 47
t y 1d k 1 2006 378 668 --------- ------ 2 455 294 76 626 1,20 3 409 637-45 657 0,90 4 429 560 19 924 1,05 5 597 708 168 148 1,39 6 575 271-22 437 0,96 7 621 722 46 451 1,08 8 514 634-107 088 0,83 9 520 043 5 409 1,01 10 321 877-198 166 0,62 11 2007 372 416 50 539 1,16 12 500 669 128 253 1,34 13 505 556 4 888 1,01 14 561 348 55 792 1,11 15 519 850-41 498 0,93 16 733 954 214 103 1,41 17 465 737-268 216 0,63 18 626 192 160 455 1,34 19 508 724-117 468 0,81 20 321 056-187 668 0,63 21 2008 444 102 123 046 1,38 22 555 577 111 475 1,25 23 511 555-44 021 0,92 24 524 030 12 474 1,02 25 498 878-25 152 0,95 26 655 875 156 997 1,31 27 698 467 42 592 1,06 28 724 580 26114 1,04 29 589 633-134 947 0,81 30 359 051-230 582 0,61 Tab. 6 Tabulka hodnot absolutních přírůstků a koefcentů růstu měsíčních tržeb 48
@ f f ¾ ½ ¾ @ ¾ n q Graf 9 Graf absolutních přírůstků měsíčních tržeb Ze sestaveného grafu je zřejmé, že absolutní přírůstky náhodně kolísají kolem konstanty. Lze tedy předpokládat, že časová řada má lneární trend, který můžeme v dalších krocích analýzy popsat. Koefcenty růstu Tato charakterstka vyjadřuje, v jakém poměru jsou hodnoty sledovaného a předchozího období. K výpočtu využjeme vzorec (1.6). k y = = 2, 3,...,n y ( y), 1 Vypočtené hodnoty jsou uvedeny v tabulce 6 ve sloupc označeném k a znázorněny v grafu 10. 49
@ f n ¾ Graf 10 - Graf hodnot koefcentů růstu měsíčních tržeb 4.3.3. Vyrovnání časové řady Z předchozí kaptoly věnované základním charakterstkám řady vyplývá, že trend časové řady lze popsat lneární funkcí. Za tuto funkc jsem zvolla přímku. Její předps je vyjádřen vztahem (1.10) uvedeným v kaptole 2.4. Koefcenty přímky lze vypočítat pomocí vzorců (1.11) a (1.12) uvedených v téže kaptole. Zde je jejch číselné vyjádření: b 2 = n = 1 n = 1 x x y 2 nx y nx b y b x= 457 719 1 = 2 2 = 3 807 Tedy dostaneme předps rovnce přímky představující vyrovnané hodnoty řady: ( x) = 457719 3807x ˆ η + Vyrovnané hodnoty jsou uvedeny v tabulce 7 a znázorněny v grafu 11. 50