VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE VYUŽITÍ LOGISTICKÉ REGRESE VE VÝZKUMU TRHU

Rozměr: px
Začít zobrazení ze stránky:

Download "VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE VYUŽITÍ LOGISTICKÉ REGRESE VE VÝZKUMU TRHU"

Transkript

1 VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické a pojistné inženýrství Diplomant: Hana Brabcová Vedoucí diplomové práce: doc. Ing. Iva Pecáková, CSc. VYUŽITÍ LOGISTICKÉ REGRESE VE VÝZKUMU TRHU školní rok 2009/2010

2 Prohlášení Prohlašuji, že jsem diplomovou práci zpracovala samostatně a že jsem uvedla všechny použité prameny a literaturu, ze kterých jsem čerpala. V Praze dne podpis

3 Poděkování Děkuji paní doc. Ing. Ivě Pecákové, CSc. za vedení práce a cenné připomínky a dále firmě TNS AISA, s.r.o. za poskytnutí zpracovávaných dat a podnětné konzultace, bez kterých by tato práce vznikala jen obtížně.

4 Abstrakt Práce si klade za cíl rozhodnout o reálných možnostech využití logistické regrese při řešení úloh běžných ve výzkumech trhu s ohledem na požadavky zadavatelů výzkumů. Argumentem pro toto zhodnocení je porovnání jejích výstupů s výstupy alternativní klasifikační metody využívané v praxi metody rozhodovacích stromů. Téma je zpracováno do tří částí. První se zaměřuje na pokrytí teoretického rámce metody logistické regrese (kapitola 2 a 3), druhá část popisuje zkušenosti s využitím metody v českých firmách zabývajících se výzkumem trhu (kapitola 4) a téma uzavírá aplikace metody na reálná data a porovnání výsledků s výstupy rozhodovacího stromu (kapitola 5 a 6). Klíčová slova: ordinální logistická regrese, multinomická logistická regrese, rozhodovací strom Abstract The aim of this work is to decide the real usage of logistic regression in the market research tasks respecting the needs of final users of research results. The main argument for the final decision is the comparison of its output to the output of an alternative classification method used in practice a classification tree method. The topic is divided into three parts. The first part describes the theoretical framework and approaches linked to logistic regression (chapter 2 and 3). The second part analyses the experience with the usage of logistic regression in Czech market research companies (chapter 4) and the topic is closed by applying the method on real data and comparing the output to the classification tree output (chapter 5 and 6). Key Words: ordinal logistic regression, multinomial logistic regression, classification tree

5 Obsah 1 Úvod Regrese Lineární regrese Klasický lineární model Zobecněný lineární model Nelineární regrese Logistická regrese Povaha kategoriálních dat Logistický regresní model Binární logistická regrese Multinomická logistická regrese Vysvětlující proměnné Indikátorové proměnné Interakce proměnných Bodový odhad parametrů Testování významnosti parametrů Intervalový odhad parametrů Nástroje pro hledání nejlepšího modelu Klasifikační tabulka Křivka ROC Postupný výběr proměnných Zkušenosti s využitím logistické regrese ve výzkumu trhu Oblasti možného využití logistické regrese ve výzkumu trhu Důvody nevyužívání logistické regrese ve výzkumu trhu Metoda rozhodovacích (klasifikačních) stromů Vlastní aplikace logistické regrese na data z výzkumu trhu Představení úlohy a formulace hypotéz Popis a příprava dat Průzkumová analýza dat Aplikace metody rozhodovacích stromů Aplikace ordinální logistické regrese Aplikace multinomické logistické regrese Křivky ROC Interpretace výsledků Závěr Literatura Přílohy Příloha Příloha

6 1 Úvod Marketing a problematika výzkumu trhu jako jeho nástroje se v českém prostředí od počátku tržního kapitalismu neustále rozvíjí. S fenoménem globalizace a sílící konkurencí je hlad firem po informacích, které by jim poskytly konkurenční výhodu, větší a větší. V České republice působí mnoho specializovaných firem a agentur zabývajících se průzkumem trhu a téměř každá větší firma má své vlastní výzkumné a marketingové oddělení. Téma využití statistických metod právě v tomto dynamickém prostředí vnímám proto jako velmi aktuální. Cílem práce je poukázat na možnosti využití metody regrese s kategoriální vysvětlovanou proměnnou ve výzkumu trhu, která bývá v praxi často opomíjena nebo nahrazována jinými metodami. Ráda bych upozornila na důvody, které brání jejímu plnému zavedení do praxe a omezení, se kterými se tato metoda na rozdíl od jiných metod musí potýkat. Práce je rozdělena do tří tematických částí. První je věnována teoretické a metodologické stránce metody logistické regrese. Druhá část zachycuje konkrétní úlohy, ve kterých je možné metodu použít a popisuje současný stav jejího využití v české výzkumné praxi. Třetí části je pak vyhrazena aplikaci metody na reálná data z výzkumu trhu a porovnání jejích výstupů s výstupy alternativní klasifikační metody rozhodovacích stromů, které je v praxi dávána přednost. Toto srovnání je hlavním podkladem pro konečné zhodnocení skutečného potenciálu využití metody logistické regrese v praxi. Přínosem práce by měl být poznatek, zda metoda poskytuje výstupy, které jsou jinými algoritmy nenahraditelné a má tedy smysl její využití v praxi obhajovat. Výsledky výzkumu by mohly být užitečné všude tam, kde se vyskytují klasifikační úlohy, a to nejen pro řešitele, ale i pro klienty výzkumných firem, kdy je potřeba zadavateli zdůvodnit, proč nebyla k řešení jeho problému využita klasická metoda logistické regrese. 2

7 2 Regrese K objasnění metody logistické regrese je velmi výhodné začít u lineární regresní analýzy. Obě metody vycházejí z myšlenky zkoumání vztahů mezi sledovanou závislou proměnnou a jednou nebo více vysvětlujícími proměnnými. Liší se v tom, že regresní analýza uvažuje na místě vysvětlované (závislé) proměnné pouze spojité veličiny, zatímco logistická regrese se zabývá výhradně úlohami s dichotomickými nebo multinomickými proměnnými nabývajícími pouze malého počtu obměn. Vzhledem k tomu, že model lineární regrese je pro logistickou regresi teoretickým východiskem, bude dobré zmínit na úvod její hlavní rysy a podmínky. 2.1 Lineární regrese Jednorozměrná lineární regresní analýza je, jak již bylo řečeno, metoda zabývající se zkoumáním závislosti změn určité spojité vysvětlované proměnné na jedné nebo více vysvětlujících (zde též spojitých) proměnných. 1 V mikroekonomii například závislost změny poptávaného množství určitého výrobku na změně jeho ceny, změně cen jeho substitutů nebo komplementů apod. Základním prvkem regresní analýzy je regresní funkce definovaná jako podmíněná střední hodnota určité náhodné veličiny vzhledem k různým lineárním kombinacím hodnot jiných náhodných veličin (regresorů) s regresními koeficienty, tedy (2.1) Vychází se z předpokladu, že každá napozorovaná hodnota vysvětlované proměnné je funkcí modelové (hypotetické) hodnoty a hodnoty rušivé (náhodné) složky. Modelová složka modelu představuje populační funkci, v praxi většinou neznámou, zahrnující působení vysvětlujících proměnných. Náhodná složka oproti tomu ztělesňuje 1 jiný typ vysvětlujících proměnných nebo faktorů připouští tzv. obecný lineární model 3

8 souhrnný vliv nekontrolovaných vlivů, stejně jako nepodstatný vliv neuvažovaných proměnných a jiných rušivých faktorů. V lineárním regresním modelu se zjednodušeně předpokládá, že mezi složkami a platí součtový vztah. Maticově je tento předpoklad zapisován ve tvaru (2.2) Z hlediska regresní teorie rozeznáváme zcela lineární model, ve kterém je předpokládán součtový vliv všech regresorů a modelová složka má tvar (2.3) a obecný lineární model, ve kterém jako regresory vystupují libovolné známé funkce vysvětlujících proměnných neobsahující žádné další parametry. Modelová složka má potom tvar (2.4) kde. Takový model nemusí být lineární z hlediska vysvětlujících proměnných. Při splnění dalších podmínek se oba tyto modely označují jako klasický lineární model a případná nelinearita je posuzována pouze z hlediska parametrů. Sestrojit funkční model, který by byl plným realistickým zobrazením skutečnosti, je v praxi velmi obtížné a ve společenských vědách často dokonce zcela nemožné, nehledě na to, že takový model by byl velice komplikovaný. Spokojujeme se proto s modelem, který je pouze určitým zjednodušeným obrazem reality a zachycuje jen hlavní rysy skutečných vztahů mezi veličinami. Při respektování podmínky použitých metod a dodržení určité obezřetnosti při interpretace výsledků mohou však být tyto modely v praxi velmi užitečné a spolehlivé (viz [5]). Zjednodušení modelu je často otázkou linearizace vztahů mezi veličinami. Lineární regresní model předpokládá linearitu v parametrech, přestože tento předpoklad není 4

9 vždy oprávněný. Různými matematickými linearizujícími transformacemi (např. rozklad Taylorovým polynomem při zanedbání členů vyššího než prvního řádu, logaritmická transformace exponenciálních nebo mocninných regresních funkcí) lze tuto skutečnost v některých případech obejít. Rizikem těchto transformací modelu je přílišné zobecnění reality a ztráta informace, ale interpretace výsledků a zpracování dat se jimi podstatně zjednodušuje. Přes to všechno však v některých situacích není možné z daných údajů uspokojivý model nalézt Klasický lineární model Pojmem klasický lineární model rozumíme tedy zcela lineární nebo obecný lineární model ve tvaru nebo (2.5) při splnění podmínek kladených na jeho jednotlivé složky (náhodnou složku, matici vysvětlujících proměnných neboli systematickou složku koeficientů ). a vektor regresních 1. Střední hodnota náhodné složky je nulová, tedy pro každé. 2. Rozptyl náhodné složky je konstantní, tedy pro každé (tzv. podmínka homoskedasticity). 3. Kovariance náhodné složky je nulová, tedy pro každé. 4. Pro danou kombinaci hodnot vysvětlujících proměnných mají hodnoty náhodné složky normální rozdělení pro každé. Z uvedených podmínek pro náhodnou složku vyplývá, že vektor hodnot rušivé složky má -rozměrné normální rozdělení s vektorem středních hodnot a s kovarianční maticí. 5

10 5. Matice je nestochastická (nenáhodná) řádu, kde je počet pozorování, je počet vysvětlujících proměnných a počet parametrů. Vysvětlující proměnné jsou nenáhodné a plně pod kontrolou výzkumníka. 6. Matice má plnou hodnost, tedy, což zajišťuje, že mezi vysvětlujícími proměnnými neexistuje funkční lineární závislost. 7. Na vektor nejsou kladeny žádné omezující podmínky. Parametry mohou nabývat libovolných hodnot pro. 2 Jsou-li splněny všechny uvedené podmínky, můžeme pro náhodný vektor vysvětlované proměnné odvodit jeho střední hodnotu (2.6) a kovarianční matici (2.7) Také vektor hodnot vysvětlované proměnné má tedy -rozměrné normální rozdělení s vektorem středních hodnot a kovarianční maticí Zobecněný lineární model V praxi představuje splnění podmínek klasického lineárního modelu spíše teoretický rámec. Je zcela běžné, že v konkrétních úlohách všechny tyto podmínky splněny nejsou. Rozšíření možností použitelnosti klasického regresního modelu umožňuje tzv. zobecněný lineární model, který při zachování podmínky nenáhodnosti matice nevyžaduje splnění podmínky týkající se kovarianční matice a náhodné složky

11 Logistická regrese uvažuje na místě vysvětlované proměnné kategoriální veličinu a narušuje tedy podmínku jejího normálního rozdělení. Použití zobecněného lineárního modelu znamená nalézt vhodnou transformující funkci, která převede nevyhovující model na klasický lineární (vyhovující podmínkám). Nejjednodušším případem logistické regrese je regrese s dichotomickou vysvětlovanou proměnnou řídící se alternativním zákonem rozdělení s pravděpodobnostní funkcí ve tvaru (2.8) Upravíme-li tento vztah následujícím způsobem (2.9) získáme logit, který je onou hledanou transformující funkcí. Při použití logitové transformace v zobecněném lineárním modelu a jeho postupnými úpravami však dostaneme nelineární regresní funkci. 2.2 Nelineární regrese Problémem nelineárních regresních funkcí je interpretace jejich parametrů. Právě z tohoto důvodu je nelinearita omezena na parametry. V lineární regresi znamená absolutní změna jednoho regresoru o jedničku konstantní změnu střední hodnoty vysvětlované proměnné právě o hodnotu regresního parametru. V logistické regresi, kdy je vysvětlující proměnná kategoriální a její střední hodnota má charakter pravděpodobnosti, nelze ani věcně uvažovat změnu za lineární. Změny tedy nejsou stejné. Příkladem může být situace, kdy například stejné zvýšení věku u určitých věkových skupin žen neznamená stejnou změnu pravděpodobnosti početí dítěte. U mladých dívek se tato pravděpodobnost zvyšuje, zatímco u starších žen naopak klesá. 7

12 Některé nelineární modely je možné tzv. linearizujícími transformacemi převést na lineární (mocninné a exponenciální vztahy zlogaritmováním), avšak u logistického modelu by to byl pouze zpětný proces vedoucí opět k nevyhovujícímu regresnímu modelu. 8

13 3 Logistická regrese Modely určené ke zkoumání vztahů mezi veličinami se obvykle dělí na modely funkční, modely pro účely řízení a modely predikční (viz [5], str. 8). Cílem logistické regrese je navrhnout model sloužící k odhadování hodnot vysvětlované proměnné. Tento model je založen na principu pravděpodobnosti zařazení nově příchozí jednotky do skupiny jí podobných jednotek pomocí zjištěných údajů. Vzhledem k tomu, že odhadujeme hodnoty kategoriální proměnné, označuje se tento proces za klasifikaci. 3 Modely tohoto typu jsou cenným nástrojem při průzkumu trhu, kdy je možné díky nim např. předpovídat chování zákazníků. Tyto informace znamenají pro firmy neocenitelnou konkurenční výhodu. Je zřejmé, že na kvalitu modelu bude mít vliv výběr vysvětlujících proměnných, jejich charakter a počet, interakce mezi proměnnými, počet kategorií vysvětlované proměnné a další faktory, které budou objasněny dále. 3.1 Povaha kategoriálních dat Při výzkumech trhu jsou výchozí data pro statistickou analýzu zjišťována přímo u statistických jednotek jednotlivců, domácností, výrobků apod. Předmětem zájmu výzkumníka jsou hodnoty sledovaných statistických znaků (proměnných). Právě v sociálních vědách, které se zajímají o názor nebo určité projevy chování lidí, se často objevují znaky, které nejsou přímo měřitelné. Respondent proto obvykle volí z předem vytvořené nabídky možných odpovědí, které jsou následně zaznamenávány jako kódy (mluvíme o kódovaných odpovědích nebo kategoriích). Kategoriální proměnné mají tedy obor hodnot tvořen škálou kategorií (viz [20], str. 9). 3 pro odhady hodnot kvantitativních proměnných se používá pojem předpověď 9

14 Podle vztahu a možnosti uspořádání kategorií uvnitř škály rozlišujeme proměnné několika typů. Nominální proměnné zkoumají např. kulturní, sociální nebo geografický původ osob, nelze u nich tedy určit pořadí kategorií ani je nijak hodnotit. Ordinální proměnné zjišťují např. vzdělání nebo preference osob, jejich jednotlivé kategorie je možné přirozeným způsobem seřadit, avšak neznáme jejich přesnou vzdálenost. Kódy kategorií kardinální proměnné lze naopak vnímat jako čísla nebo počet a je možné určit jejich vzájemnou vzdálenost a poměr (někdy se proto označují také jako poměrové proměnné). Příkladem může být počet ekonomicky aktivních osob v domácnosti nebo počet hodin věnovaných určité činností apod. Do této skupiny patří také agregované kategorie vzniklé z původně spojitých hodnot (např. příjem osob v Kč podle tisícových intervalů). Všechny proměnné mající více než dvě kategorie se označují za multinomické. Zvláštním typem kategoriální proměnné je proměnná dichotomická (alternativní) nabývající pouze dvou hodnot, pro kterou se užívá kódování 0 1. Pokud mají obě odpovědi pro výzkumníka stejný význam, jedná se o symetrickou dichotomickou proměnnou (např. pohlaví osoby). Pokud je jedna odpověď významnější než druhá, jde o asymetrickou proměnnou (např. zájem o nějakou službu, vlastnictví nějakého výrobku). Tato a další dělení se v literatuře liší, avšak je zřejmé, že charakter používaných proměnných ovlivňuje následnou volbu analytických metod a tedy i dosažené výsledky. V závislosti na použitém typu kategoriální vysvětlované proměnné rozlišujeme logistickou regresi binární a multinomickou a tu dále dělíme podle vztahu mezi kategoriemi na ordinální a nominální logistickou regresi. 3.2 Logistický regresní model Použití klasického lineárního modelu pro úlohy s kategoriální vysvětlovanou proměnnou není vhodné vzhledem k obtížnému naplnění daných podmínek. Dále bude tedy pozornost tedy věnována logistickému regresnímu modelu, který je zvláštním 10

15 případem zobecněného lineárního modelu s logitovou transformující funkcí a vzhledem ke svému tvaru spadá do kategorie nelineární regrese. Logistický regresní model je možné vyjádřit jako pravděpodobnost, šanci (odds ratio) nebo logaritmus šance (logit). Mezi jednotlivými vyjádřeními existuje jednoduchý matematický vztah, jsou na sebe tedy snadno převoditelná, avšak je třeba určité obezřetnosti při interpretaci výsledků, kdy dochází často k záměně těchto pojmů Binární logistická regrese Pokud má vysvětlovaná veličina alternativní rozdělení, tedy se střední hodnotou, je obor jejích hodnot omezen na hodnoty 0 a 1 tak, že jev nastane s pravděpodobností a jev nastane s pravděpodobností. Pravděpodobnosti nastoupení obou těchto jevů jsou dány intervalem. Použití lineární regresní funkce by nemohlo omezení na tento interval zajistit. Uvažujeme proto poměr pravděpodobnosti úspěchu ku pravděpodobnosti neúspěchu, který je označován jako šance (odds ratio), a může naopak nabýt jakékoli nezáporné hodnoty. Použijeme-li v zobecněném lineárním modelu místo podmíněné střední hodnoty logaritmus šance (logit) (3.1) dojdeme k binárnímu logistickému regresnímu modelu (resp. regresní funkci s logitovou transformací ), ve kterém je logit vyjádřen jako lineární funkce vysvětlujících proměnných (např. [21], str. 187). Postupnou zpětnou úpravou výrazu dostáváme vztah vyjádřený jako šanci (3.2) a dále jako pravděpodobnost 11

16 (3.3) což je vlastně distribuční funkce logistického rozdělení, jejíž použití zajišťuje potřebné omezení hodnot na interval. Podmíněná střední hodnota alternativní vysvětlované proměnné je potom vyjádřena jako nelineární funkce proměnných. vysvětlujících Je-li, má distribuční funkce (3.3) tvar (3.4) a grafem této nelineární funkce (pro ) je symetrická rostoucí s-křivka s jedním inflexním bodem. Hodnota veličiny je 100π% kvantil normovaného logistického rozdělení. (Podobnou distribuční funkci se stejným inflexním bodem má také normované normální rozdělení jeho 100π% kvantil se označuje jako probit). Pro záporné hodnoty a záporné hodnoty se ale blíží a pro kladné hodnoty se blíží. V tomto případě je křivka klesající a nejedná se proto už o distribuční funkci. V případě nezávislosti vysvětlované proměnné na je parametr roven nule (viz [7], str. 40). Parametr udává velikost logitu pro nulové hodnoty všech vysvětlujících proměnných a je logaritmem šance, že. Je-li tato šance (tedy šance jedna ku jedné), je parametr. Kladné hodnoty parametru potom znamenají větší šanci nastoupení sledovaného jevu ( a záporné hodnoty menší šanci nastoupení tohoto jevu (větší šanci nastoupení jevu alternativního). Následující obrázek 3-1 znázorňuje logitovou křivku pro parametry a. 12

17 šance Obr. 3-1 Logitová křivka pro parametry a 1,0 0,8 0,5 0,3 0, x Zdroj: Vlastní nákres V závislosti na počtu vysvětlujících proměnných se logaritmus šance mění. Míra této změny je obecně vyjadřována parametry,, avšak z rovnice (3.3) vyplývá, že její skutečná velikost je rovna násobku šance při změně nezávislé proměnné o jedničku a nezměněných hodnotách ostatních proměnných Multinomická logistická regrese 4 Úlohy s vícekategoriální vysvětlovanou proměnnou lze také řešit pomocí logistické regrese, avšak nikoli jejím opakovaným použitím. Přirozeným rozšířením binárního logistického modelu je multinomická logistická regrese. Před její aplikací je ale potřeba nejprve zvážit vztahy mezi kategoriemi vysvětlované proměnné, neboť jejich charakter umožňuje využití různých konstrukcí logitů a ovlivňuje tak i interpretaci parametrů. 4 terminologie není v české literatuře ustálená, pro označení logistické regrese s vícekategoriální vysvětlovanou proměnnou se lze setkat např. s označením polytomická regrese 13

18 Nominální vysvětlovaná proměnná Kategorie nominální proměnné nelze uspořádat do logické řady. Jediné, co o nich lze prohlásit je, že jsou navzájem různé. Pokud je takových kategorií, použijí se pro ně v souladu s předchozí teorií kódy, přičemž jedna z nich se označí za tzv. referenční (srovnávací) kategorii. Pravděpodobnost nastoupení této kategorie je považována za bazickou a ostatní pravděpodobnosti příslušející zbylým kategoriím jsou s ní porovnávány. Tento způsob konstrukce logitu (jde o tzv. bazické logity) pro nominální proměnnou převažuje. Druhým způsobem konstrukce je porovnání pravděpodobností nastoupení sousedících kategorií (tzv. řetězové logity), avšak tento postup nachází větší uplatnění, je-li kategoriální proměnná ordinální, které je věnována následující subkapitola. Má-li tedy vysvětlovaná proměnná obecně nominálních kategorií, lze vyjádřit vztah mezi touto proměnnou a vysvětlujícími proměnnými pomocí rovnic (logitů). Budeme proto vždy odhadovat parametrů. Za referenční lze zvolit libovolnou kategorii. V souladu s dalším postupem uvedeným v [15], str , značíme pravděpodobnost nastoupení určitého jevu jako a pravděpodobnost jeho nenastoupení jako. V návaznosti na binární logistickou regresi můžeme zapsat logistické funkce pro jako kde (3.5) kde (3.6) Analogicky pro pak dostaneme kde (3.7) (3.8) 14

19 (3.9) obecně tedy pro nominálních kategorií kde (3.10) Nyní můžeme vyjádřit logity jako bazické logity, tj. jako logaritmy šancí nastoupení jevu určité kategorie ku nastoupení jevu referenční kategorie a (3.11) obecně tedy kde (3.12) Obdobně jako u binomické logistické regrese vyjadřují tedy parametry v modelu s vícekategoriální vysvětlovanou proměnnou změnu logaritmu šance, zde šance, že vysvětlovaná proměnná nabude hodnoty -té kategorie a ne referenční, při nezměněných hodnotách ostatních nezávislých proměnných. Parametry vyjadřují velikosti logitů jednotlivých kategorií při nulových hodnotách všech vysvětlujících proměnných. Ordinální vysvětlovaná proměnná Oproti nominální proměnné lze kategorie ordinální veličiny uspořádat do logické řady, aniž bychom znali vzdálenost mezi těmito kategoriemi. Díky tomuto faktu je možné zvolit i jiné postupy odvození logitu než v případě nominální vysvětlované veličiny. 15

20 Jednou z možností je vyjádřit logit jako logaritmus šance, že nastane určitý jev a ne jev předchozí kategorie. Tyto logity jsou označovány za řetězové a můžeme je obecně zapsat jako kde (3.13) Druhou možností jsou tzv. kumulativní logity a na rozdíl od předchozích úvah vycházejí z poměru kumulovaných pravděpodobností (tedy distribučních funkcí ) a ne z poměru jednotlivých pravděpodobnostních funkcí. Obecný zápis má tedy podobu (viz. [15], str. 94) kde (3.14) Parametry představují opět velikosti jednotlivých logitů pro nulové hodnoty každé z kategorií vysvětlované veličiny. Pro kumulativní logity však navíc platí, že. Parametry potom představují vliv příslušných proměnných na pokles šance, že veličina nabude s růstem hodnot vysvětlujících proměnných vyšší a ne nižší kategorie a naopak. V této souvislosti stojí za zmínku model proporcionálních šancí (proportional odds model), který vzniká lineární kombinací vysvětlujících proměnných ve snaze dosáhnout přirozenější interpretace. Jeho parametry jsou pak shodné pro všechny kategorie vysvětlované proměnné. Třetí možnost slučuje obě předchozí varianty, jde o tzv. kombinované logity. V jejich definici jsou využity jak hodnoty pravděpodobnostních, tak distribučních funkcí. Obecný zápis má tvar 16

21 kde (3.15) Parametry zde reprezentují vliv každé z proměnných na změnu šance, že vysvětlovaná proměnná nabude hodnoty z -té kategorie a ne z některé předcházející, při zachování konstantních hodnot ostatních proměnných. Specifikum tohoto modelu je, že jej lze odhadovat pomocí soustavy binárních logistických regresních funkcí postupně pro jednotlivé kategorie. 3.3 Vysvětlující proměnné Stejně jako v lineární regresi lze i v logistickém modelu použít různý typ vysvětlujících proměnných. Na jejich charakteru závisí další postup konstrukce modelu, odhad jeho parametrů, hodnocení kvality i jeho konečné využití. V případě, kdy jsou též vysvětlující proměnné kategoriální (a v praxi to není nijak neobvyklé například zkoumání závislosti zájmu respondenta o určitý výrobek v závislosti na pohlaví, gramotnosti, zdravotním stavu apod.), vyskytují se jejich nulajedničkové kombinace opakovaně a je obtížnější usuzovat na závislost změn vysvětlované proměnné na těchto stejných kombinacích. (Pokud by byla mezi proměnnými zastoupena spojitá proměnná, byly by jednotlivé kombinace jedinečné). Z tohoto důvodu je dobré nejprve roztřídit data obsahující pouze kategoriální proměnné do kontingenční tabulky a analyzovat až jednotlivá pole tabulky. Četnosti výskytu kombinací, pro něž nabývá veličina s pravděpodobnostní funkcí hodnoty 1, mají binomické rozdělení, (3.16) kde je počet případů, kdy vysvětlovaná veličina nabývá hodnoty 1 a je celkový počet případů pro jednu konkrétní kombinaci hodnot vysvětlujících proměnných. Vysvětlovanou proměnnou v regresním modelu je potom relativní četnost nastoupení 17

22 sledovaného znaku pro tuto určitou kombinaci hodnot nezávislých proměnných, tedy (viz [7], str ) Indikátorové proměnné V praxi je zvykem označovat jednotlivé kategorie kategoriální proměnné pořadovými čísly, např. 1 = svobodný, 2 = ženatý, 3 = rozvedený, 4 = vdovec, avšak toto označení nemá žádný kvantitativní význam. Nejčastější přístup k práci s kategoriální proměnnou spočívá v tom, že se kategorie této proměnné překódují na umělé proměnné, korespondující s původními, tzv. indikátorové proměnné. Interpretace odhadnutých parametrů potom závisí na typu zvolených indikátorů. Důsledkem použití tzv. dummy proměnné jsou parametry představující změnu každé kategorie (v logistické regresi změnu šance) oproti referenční kategorii. Výskyt určité kategorie je indikován kódem 1 a kategoriím, které se nevyskytují, je přiřazena nula. Následující Tabulka 3-1 ukazuje konkrétní příklad tohoto kódování pro proměnnou rasa (podrobněji viz [8], str. 56). Tabulka 3-1 Příklad kódování dummy pro proměnnou Rasa využívající jako referenční kategorii Běloch RASA Kód RASA_2 RASA_3 RASA_4 Běloch (1) Černoch (2) Hispánec (3) Jiná (4) Zdroj: Hosmer a Lemeshow Jiným typem indikátorových proměnných jsou tzv. effect proměnné. 5 v tomto případě představují parametry změnu logitu každé kategorie oproti průměru logitů všech 5 Hosmer a Lemeshow v *8+ uvádí označení deviation from means 18

23 použitých kategorií. Kromě kódů nula a jedna zde přibývá kód -1 pro referenční kategorii. Použití tohoto typu kódování a tedy i interpretace následně vypočtených parametrů ovšem závisí na tom, dává-li průměr šancí smysl. Příklad tohoto typu kódování je uveden v Tabulce 3-2. Tabulka 3-2 Příklad kódování effect pro proměnnou Rasa využívající jako referenční kategorii Běloch RASA Kód RASA_2 RASA_3 RASA_4 Běloch (1) Černoch (2) Hispánec (3) Jiná (4) Zdroj: Hosmer a Lemeshow Pokud parametr referenční kategorie představuje průměrnou úroveň logitů všech kategorií této proměnné, přičemž význam ostatních parametrů zůstává zachován (tj. jedná se logaritmy šancí, že nabudou hodnoty -té kategorie a ne průměrné hodnoty logitů všech kategorií), jde se o indikátorovou proměnnou simple (viz Tabulka 3-3). Opět platí, že průměr šancí by měl mít smysl. Tabulka 3-3 Příklad kódování simple pro proměnnou Rasa využívající jako referenční kategorii Běloch RASA Kód RASA_2 RASA_3 RASA_4 Běloch (1) Černoch (2) Hispánec (3) Jiná (4) Zdroj: Upraveno z [14], str. 74 Posledními zde zmíněnými indikátorovými proměnnými jsou proměnné typu profile. Parametry založené na těchto indikátorech vyjadřují logaritmus šance, že nastane jev -té kategorie a ne jev kategorie předchozí. Příklad uvádí Tabulka

24 Tabulka 3-4 Příklad kódování profile pro proměnnou Spokojenost SPOKOJENOST Kód SPK_1 SPK_2 SPK_3 SPK_4 Nespokojen (1) Spíše nespokojen (2) Spíše spokojen (3) Spokojen (4) Zdroj: Upraveno z [14], str. 77 Výčet typů indikátorových proměnných není úplný (více např. [14]), avšak již tak je zřejmé, že při změně kódování (referenční kategorie není nulová apod.), získávají parametry zcela jiný význam, a je proto nutná jistá dávka obezřetnosti při jejich interpretaci Interakce proměnných Kromě charakteru jednotlivých vysvětlujících proměnných je dobré zkoumat také jejich vzájemný vztah. Interakce mezi vysvětlujícími proměnnými je totiž přirozeným jevem všech regresních úloh a zahrnutí proměnné vyjadřující současné působení dvou a více jevů do modelu může vést k rozdílné úrovni vysvětlované proměnné a tedy významné změně interpretace parametrů. V případě spojitých proměnných nezpůsobí zahrnutí těchto dodatečných proměnných do modelu žádné větší komplikace, protože jejich význam je jednoznačný a zřejmý. Složitější situace nastává v případě interakce kategoriálních proměnných, kdy proměnná vyjadřující jejich vzájemnou součinnost vstupuje do modelu v podobě nové sady kódovaných proměnných. Jak bylo ukázáno výše, pro indikátorové proměnné je charakteristické, že způsob, kterým byly vytvořeny, má zásadní vliv na interpretaci parametrů a právě z tohoto důvodu nemusí být vždy snadné tuto interakci rozumně interpretovat. (Této problematice se podrobně věnuje Hosmer a Lemeshow [8], str ). 20

25 3.4 Bodový odhad parametrů Logistická regresní funkce je nelineární ve svých regresních parametrech. Jejich bodový odhad se provádí metodou maximální věrohodnosti, která spočívá v nalezení maxima věrohodnostní funkce. Má-li vysvětlovaná proměnná binomické rozdělení,, a jsou-li jednotlivá pozorování nezávislá, je možné zapsat věrohodnostní funkci jako součin pravděpodobností jednotlivých pozorování, viz [10]. (3.17) Po dosazení již odvozeného vzorce pro logistickou regresi (3.3) do vztahu (3.17), dostaneme věrohodnostní funkci ve tvaru (3.18) který je možné jednoduchou úpravou dále zjednodušit do podoby (3.19) Hledání parametrů, pro které věrohodnostní funkce nabývá svého maxima, je snazší po jejím zlogaritmování. Má-li logistická funkce pouze dva parametry (tedy jedinou vysvětlující proměnnou), lineární kombinace vysvětlujících proměnných získá tvar, a logaritmus věrohodnostní funkce bude mít podobu (3.20) 21

26 Nyní stačí položit první derivace podle jednotlivých parametrů rovny nule a vyřešit soustavu vzniklých nelineárních rovnic. V případě parametrů a dostaneme soustavu (3.21) Odhad parametrů z této soustavy nelineárních rovnic se provádí iteračními postupy nejlépe za pomoci výpočetních systémů. Využívána je zejména metoda tečen (zvaná též jako Newtonova nebo Newton-Raphsonova metoda podrobněji např. [23]), která spočívá ve využití Taylorova rozkladu v okolí počátečního odhadu (získaného například modifikací pomocí výběrových logitů více [7], str. 42) a hledá maximum logaritmu věrohodnostní funkce pro jeho první členy. Upravený odhad je zároveň výchozí hodnotou pro další krok iterace. Výhoda tohoto algoritmu spočívá v jeho poměrně rychlém přibližování k maximálně věrohodnému odhadu parametrů. Zároveň je v každém iteračním kroku počítána kovarianční matice odhadů parametrů, jejíž prvky z hlavní diagonály (rozptyly) je možné dále použít při konstrukci směrodatných chyb bodových odhadů i intervalů spolehlivosti. Uvažujeme-li i nadále pouze jednu vysvětlující proměnnou, můžeme pak snadno zapsat vzorec pro bodový odhad logitu, který vychází z maximálně věrohodných bodových odhadů parametrů, jako (3.22) Odhady jsou ve vzorci označeny stříškou. Podobně jednoduchým způsobem je možné odvodit vzorec pro odhad rozptylu logitu, tedy 22

27 (3.23) kde znamená odhad rozptylu daného bodového odhadu parametru a značí odhad příslušné kovariance. Obecně se tedy rozptyl součtu rovná součtu rozptylů každého členu a dvojnásobku kovariance mezi každými dvěma členy. 3.5 Testování významnosti parametrů Získané hodnoty regresních koeficientů samy o sobě nestačí k rozhodnutí o tom, zda má daná nezávislá proměnná významný vliv na vysvětlovanou proměnnou a je tedy vhodná pro klasifikaci. Pro vyslovení těchto závěrů je nutné zjištěné parametry nejprve nějakým způsobem otestovat. Nejčastěji se test provádí formulováním hypotézy o statisticky nevýznamném vlivu zvolené vysvětlující proměnné na vysvětlovanou proměnnou. Jejím zamítnutím se proměnná považuje za vhodnou a může být v modelu ponechána. Nejjednodušším testem významnosti pro parametr je test založený na Waldově statistice, která je poměrem odhadnuté hodnoty parametru a jeho směrodatné chyby (odhad je ve vzorci značen stříškou) (3.24) Tato statistika má asymptoticky normované normální rozdělení a slouží jako testové kritérium pro ověření hypotézy, že parametr nabude hodnoty nula. Je tedy jakousi alternativou individuálního -testu v lineární regresi. Tento test může dobře posloužit pro první orientaci, avšak jeho použití je omezeno na situace, kdy parametr nabývá malých absolutních hodnot. V opačném případě totiž narůstá také směrodatná chyba odhadu tohoto parametru, hodnoty Waldovy statistiky vychází příliš malé a téměř nikdy nevedou k zamítnutí testované hypotézy. V praxi je proto výhodnější použít nějaký jiný typ testu. 23

28 Hosmer a Lemeshow ([8], str. 92) od statisticky významné proměnné požadují, aby model zahrnující tuto proměnnou poskytoval více informací o závislé proměnné než model, který ji nezahrnuje. Podstata hodnocení kvality modelu pomocí následujících statistik spočívá v porovnání napozorovaných hodnot vysvětlované proměnné s jejími teoretickými hodnotami z modelu vypočtenými. V lineární regresi se posuzují vzdálenosti mezi napozorovanými a empirickými hodnotami pomocí reziduálního součtu čtverců, které se určí jak pro variantu obsahující sledovanou vysvětlující proměnnou, tak pro variantu bez ní. Z praxe je známo, že přidáním libovolné proměnné do modelu reziduální součet čtverců vždy klesne. Pro rozhodnutí o statistické významnosti proměnné a jejího parametru je tedy rozhodující velikost této změny. V logistické regresi nepracujeme s modelem lineárním v parametrech a o kvalitě modelu se proto rozhoduje pomocí poměru dvou věrohodnostních funkcí (3.17) na základě zjištěných a vypočítaných hodnot, tzv. test věrohodnostním poměrem. Vzorec v následujícím tvaru (teoretické hodnoty jsou označeny stříškou) (3.25) který je možné zjednodušit do podoby (3.26) se označuje jako deviance a v logistické regresi má stejnou vypovídací schopnost jako reziduální součet čtverců v lineární regresi. Rozhodnutí o statistické významnosti rozdílu deviancí obou modelů (3.27) je potom klíčové také pro rozhodnutí o statistické významnosti sledované proměnné. 24

29 Porovnáváme-li tedy dva různé modely s počty parametrů a, přičemž (pro jednoduchost uvažujme i nadále pouze jednu vysvětlující proměnnou, tedy ), dostaneme po dosazení příslušných deviancí (3.26) do vztahu (3.27) testové kritérium ve tvaru (3.28) kde čitatel v závorce představuje věrohodnostní funkci modelu neobsahujícího žádnou proměnnou, přičemž a, a které má rozdělení s stupni volnosti (podrobněji *8+, str. 14). Porovnáním vypočtené hodnoty s příslušným kvantilem rozdělení je možné provést konečné rozhodnutí ve prospěch nebo neprospěch testované hypotézy o nulovém vlivu sledované proměnné na vysvětlovanou proměnnou. Tato statistika je obdobou sekvenčního -testu v lineární regresi. Oba zmíněné testy významnosti Waldův test i test věrohodnostním poměrem vyžadují výpočet maximálně věrohodného odhadu parametru Tomuto výpočtu je možno se vyhnout použitím tzv. Score testu. Jeho výhodou je výpočetní jednoduchost, avšak ne všechny statistické pakety ho nabízejí. Vzorec Score testu je odvozen např. v [8], str. 17, vychází z věrohodnostní funkce (3.17) a má tvar (3.29) Čitatel je roven vzorci pro výpočet maximálně věrohodného odhadu parametru, při využití vztahu a jmenovatel odpovídá vzorci pro odhad rozptylu toho parametru. Score test má rozdělení a porovnáním příslušného kvantilu s vypočtenou hodnotou můžeme opět rozhodnout o statistické významnosti testované proměnné. 25

30 3.6 Intervalový odhad parametrů Konstrukce intervalů spolehlivosti pro parametry vychází ze stejné teorie jako testování významnosti jejich bodových odhadů. Odhad šířky daného intervalu spolehlivosti využívá maximálně věrohodný bodový odhad, kde, jehož rozdělení se asymptoticky blíží normovanému normálnímu. Krajní body intervalů mají proto tvar (3.30) kde je příslušný kvantil normovaného normálního rozdělení a je odhad směrodatné chyby tohoto odhadu. Intervalový odhad logitu je konstruován zcela shodným způsobem. S využitím vzorců pro jeho bodový odhad a rozptyl (3.22, 3.23), získáváme (3.31) kde je kladná odmocnina odhadu rozptylu. 3.7 Nástroje pro hledání nejlepšího modelu Kvalita logistického regresního modelu je posuzována podle toho, jak dobře je schopen správně klasifikovat objekty do kategorií vysvětlované proměnné na základě vysvětlujících proměnných, tedy jak dobře plní svou hlavní funkci. Nástrojů pro hodnocení kvality získaného modelu je celá řada. Vzhledem k podobnosti s diskriminační analýzou je přirozené, že se analytické nástroje obou metod prolínají, zejména použití klasifikačních tabulek a grafů. 26

31 3.7.1 Klasifikační tabulka Uvažujeme-li obecně vysvětlovanou proměnnou s kategoriemi, je možné rozdělit zkoumaný soubor jednotek na skupin podle toho, zda nabývají ve sledovaném znaku hodnoty 6 Každá z těchto skupin má v populaci určité pravděpodobnostní zastoupení. Je-li model toto rozdělení veličiny schopen reprodukovat, dokáže také jednotky správně klasifikovat do příslušných skupin. Matematická analýza se provádí pomocí čtyřpolní klasifikační tabulky (Tabulka 3-5) obsahující četnosti správně i chybně zařazených jednotek. Kvalita testu je poté posuzována podle podílu správně klasifikovaných objektů (součet diagonálních prvků tabulky) k celkovému počtu klasifikovaných jednotek. Zde tedy podílu. Tabulka 3-5 Čtyřpolní klasifikační tabulka Skutečnost Test Y = 1 Y = 0 Celkem Y = 1 a c a + c Y = 0 b d b + d Celkem a + b c + d n Zdroj: Hosmer a Lemeshow Křivka ROC Jiný způsob znázornění diskriminační schopnosti modelu je pomocí tzv. ROC křivky (Receiver Operating Characteristic). Celý graf má podobu jednotkového čtverce. Jeho svislá osa je vyhrazena pro tzv. senzitivitu, neboli procento případů, které byly správně označeny jako pozitivní vzhledem ke zkoumanému jevu, tj. podíl. Vodorovnou osu potom tvoří tzv. 100 specificita, neboli planý poplach, kdy bylo jednotkám chybně přiřazeno nastoupení jevu, tj. doplnění podílu do jedné. 6 záleží na typu zvolené indikátorové proměnné 27

32 Správně zpozitivní hodnoty (Sensitivity) % Příklad křivky ROC je zakreslen na obrázku 3-3. Každý bod v grafu představuje kombinaci hodnot senzitivity a (100 specificity) a odpovídá konkrétní křivce (např. plná čára). Pokud křivka prochází levým horním rohem (tečkovaná čára), je dosaženo největší shody skutečných a testem zjištěných četností a dochází k nejlepší klasifikaci objektů. V případě, že model žádnou diskriminační schopnost nemá a jednotky jsou k jednotlivým kategoriím přiřazovány zcela náhodně, má křivka ROC tvar diagonály plochy grafu (přerušovaná čára). Obr. 3-2 Křivka ROC Chybně pozitivní hodnoty (100 - Specificity) % Zdroj: Vlastní nákres Kvalitu modelu je možné posuzovat podle ukazatele AUC (Area Under ROC Curve) neboli plochy pod křivkou ROC. Čím více se tato plocha blíží 100 % základního čtverce, tím lépe model jednotky klasifikuje. Některé další postupy pro hodnocení modelu byly již zmíněny v souvislosti s posuzováním statistické významnosti parametrů vysvětlovaných proměnných, kde byly vodítkem pro rozhodnutí o zařazení proměnné do modelu. Jako nejužitečnější byla označena deviance, neboli test věrohodnostním poměrem (3.25) k porovnání dvou 28

33 různých modelů. Jeho nevýhodou je, že v případě velkého počtu parametrů dochází k upřednostňování složitějších modelů s více proměnnými, neboť větší počet parametrů znamená vždy větší shodu modelových hodnot se zjištěnými daty. Z tohoto důvodu jsou pro testování kvality modelu využívány různé modifikace testu zohledňující počet parametrů. Mezi nimi je například Akaikeho informační kritérium případně Goodmannův index nebo Bayesovské kritérium. Ve všech třech případech znamená nižší hodnota kritéria vhodnější model. Další modifikace testu uvádí např. [15], str Postupný výběr proměnných S hledáním nejlepšího modelu přímo souvisí také výběr nejvhodnější podmnožiny proměnných ze škály všech dostupných nezávislých proměnných. Cílem je nalézt takovou kombinaci regresorů, která by co nejlépe vysvětlovala pravděpodobnost výskytu zkoumaného jevu a zároveň zachovala jednoduchou strukturu modelu. Jak bylo zmíněno výše, přidání jakékoli další proměnné do existujícího modelu zvýší procento vysvětlené variability, a proto je hlavní snahou nalézt vhodný kompromis mezi jednoduchostí modelu a jeho vypovídací schopností. Hosmer a Lemeshow [8] navrhují začít výběr jednorozměrnou analýzou testování významnosti pro každý parametr. V případě dichotomické vysvětlující proměnné a nominální, ordinální nebo spojité vysvětlující veličiny s malým počtem hodnot je k této analýze nejvhodnější kontingenční tabulka s výstupy versus nezávislých proměnných. K otestování shody kvality těsnosti daných a nalezených četností se využívá Pearsonův test dobré shody s stupni volnosti, který je asymptoticky shodný s testem věrohodnostním poměrem. Hosmer a Lemeshow ([8], str. 93) upozorňují v tomto směru na kontingenční tabulky obsahující nuly, neboť bodový odhad některých šancí by byl nulový nebo nemožný. Některé výpočetní systémy nedovedou takové situace řešit, a proto autoři doporučují kategorie s nulovými výskyty nahradit jinými nebo zcela vypustit. V případě jediné spojité vysvětlující proměnné je 29

34 k otestování vhodný již zmíněný Waldův test nebo dvouvýběrový -test se stanovenou -hodnotou. Tuto statistiku lze dobře využít v případě, kdy se rozdělení sledované spojité vysvětlující proměnné blíží normálnímu. Po otestování jednotlivých proměnných je možné přistoupit k hledání modelu s více proměnnými. Hosmer a Lemeshow doporučují vybírat pro vícerozměrný model ty proměnné, pro něž hodnota -value nepřekročí hranici 0,25. S odkazem na literaturu Mickey and Greenland (1987) upozorňují, že tradiční hodnota 0,05 často vede k opomenutí proměnných, které do modelu věcně patří. Použití méně přísné hodnoty však znamená zahrnutí i těch proměnných, jejichž přítomnost v modelu je sporná, a proto je k jejich ponechání v konečném modelu velmi důležitá také věcná analýza a znalost problematiky, kterou se model snaží popsat. Jinou metodou výběru proměnných je metoda postupné regrese, tzv. stepwise regression. Tato metoda se dále dělí podle toho, zda se jedná o postupné zařazování proměnných do modelu, tzv. forward stepwise (někdy též forward selection) nebo postupné vyřazování, tzv. backward elimination. (Hosmer a Lemeshow píší ještě o metodě best subset regression, která však v logistické regresi není tolik rozšířená, proto zde uvádím pouze odkaz na literaturu [8], str Metoda postupné regrese (forward stepwise) je velmi používaná v lineární regresi, kde vychází ze zkoumání přírůstku regresního součtu čtverců (součet čtverců rozdílu vyrovnaných hodnot od průměru) pomocí sekvenčních -testů nebo ze zvýšení indexu determinace. V logistické regresi se za ukazatel statistické významnosti považuje především změna věrohodnostního poměru, jak bylo popsáno v kapitole 3.5, testovaná pomocí statistiky (3.27). Proměnné do modelu jsou zařazovány v tom pořadí, v jakém přispívají k největšímu rozdílu deviancí oproti modelům, které je neobsahují. Podrobný postup je uveden v [8], str Při metodě backward elimination se naopak vychází z modelu se všemi vysvětlujícími proměnnými a na základě poklesu rozdílu deviancí se zkoumá, která proměnná má být 30

35 vypuštěna. Ať už je ale k výběru finálního modelu zvolena jakákoli metoda, je dobré na tomto místě upozornit na výrok z již několikrát citované práce Hosmera a Lemeshowa, vyzdvihující konečnou úlohu statistika při konstrukci modelu, totiž že za přezkoumání a kontrolu proměnných v modelu je zodpovědný výhradně analytik, nikoli počítač. Pouze v případě, že analytik zná silné a zejména slabé stránky těchto metod, mohou mu posloužit jako užitečný nástroj v procesu výstavby modelu ([8], str. 96). 31

36 4 Zkušenosti s využitím logistické regrese ve výzkumu trhu Pro klasifikaci nově příchozích jednotek do skupin vytvořených pomocí vstupních údajů zvolených vysvětlujících proměnných je vyvinuto v praxi několik metod. Síla metody regrese a logistické regrese spočívá zejména v jejich tradici a propracované teorii odhadu chyb, ale jejich použití je limitováno velikostí firemních databází při složitějších modelech. Pro tuto část práce jsem oslovila některé velké společnosti s letitými zkušenostmi v oblasti výzkumu trhu, abych zjistila jaké uplatnění má metoda logistické regrese v české statistické praxi. Zajímala mě specifika zadávaných úloh a způsoby jejich řešení. Mezi oslovenými společnostmi byli TNS AISA, s.r.o., Millward Brown Czech Republic, s.r.o., STEM/MARK, a.s. a PPM FACTUM. S firmami TNS AISA, s.r.o. a PPM FACTUM se mi podařilo navázat velmi dobrý kontakt, avšak i přes jejich ochotu nebyly zjištěné výsledky pro využití metody logistické regrese příznivé. Následující odstavec se věnuje charakteru úloh vyskytujících se nejčastěji v oblasti výzkumu trhu. Všechny zmíněné příklady je možné řešit logistickou regresí, neboť se jedná o situace zaměřené na predikci, avšak dále bude ukázáno, jakým jiným způsobem je také možné tyto úlohy efektivně uchopit. 4.1 Oblasti možného využití logistické regrese ve výzkumu trhu Teoretický potenciál využití logistické regrese ve výzkumu trhu je poměrně velký. K dokreslení představy o šíři spektra marketingových průzkumů zde uvádím přehled některých možných typů úloh z praxe zaměřených na predikci zmíněných v práci Pospíšila a Nemravy [16]. 32

37 Prvním a zároveň nejtypičtějším příkladem využití modelů klasifikace je analýza úvěrového rizika z oblasti bankovnictví. Pomáhá bance ověřit kredibilitu nově příchozích klientů žádajících o úvěr a s jeho pomocí vyhovět těm klientům, u nichž je riziko neschopnosti splácet malé. Výhodou těchto úloh je, že banky mají dostatečné množství informací o chování svých současných klientů, na jejichž základě je pak možné model poměrně snadno sestavit. Dalším typem úloh z bankovního a pojistného prostředí je detekce podvodů. S pomocí prediktivního modelu je možné odhalit např. podezřelé chování v platebním styku a chránit tak klienty před zneužitím jejich platebních karet. Podpůrným nástrojem pro strategická marketingová rozhodnutí je segmentace zákazníků, jejímž cílem je rozdělení zákazníků (na základě o nich zjištěných dat) do skupin představujících různé segmenty se specifickými vlastnostmi a potřebami. Databáze tohoto typu se pořizují dotazováním u náhodně vybraných osob nebo domácností a vedou je firmy zabývající se průzkumy trhu. Nástrojem pro zhodnocení správnosti marketingových rozhodnutí je vyhodnocování marketingových kampaní, které zjišťuje odezvu na reklamu nebo určitou formu podpory prodeje opět pomocí dat zjištěných o zákaznících. Výstupy pomáhají rozhodnout o budoucím správném zacílení kampaně k dosažení požadovaného efektu (zvýšení prodeje, posílení pozice na trhu apod.). Analýza odchodu zákazníků je důležitým nástrojem, který je schopen odhalit faktory způsobující neloajalitu jednotlivých typů klientů. Na základě poznatků o těchto faktorech je potom možné provádět již cílená opatření k udržení odcházejících zákazníků. Význam mají tyto úlohy například pro poskytovatele telekomunikačních nebo jiných služeb, zajímat by se o ně ale mohli také političtí představitelé. Analýza produktů dovede najít segmenty zákazníků s podobnými potřebami a umožňuje sestavovat balíčky služeb šité na míru konkrétním klientům. Využití takových modelů může být užitečné například pro cestovní kanceláře. 33

38 Výčet samozřejmě není úplný, přesto je asi zřejmé, že oblastí využití klasifikačních metod ve výzkumu trhu je mnoho. Logistická regrese má samozřejmě své uplatnění i v jiných oborech, jen namátkou jmenujme např. zdravotnictví a analýzu výskytu onemocnění, příčin smrti atd., biologii a klasifikaci nově nalezených druhů nebo různé sociologické průzkumy o veřejném mínění. 4.2 Důvody nevyužívání logistické regrese ve výzkumu trhu Přes rozsáhlou teoretickou koncepci možného využití logistické regrese v průzkumu trhu jsou zkušenosti z praxe diametrálně odlišné. Metoda logistické regrese je v české statistické praxi podle zkušeností firem zabývajících se průzkumy trhu téměř vytlačena jinými metodami. Na tomto místě je potřeba zdůraznit specifika oboru, kterým je samotný průzkum trhu. Zadavateli výzkumů jsou zde výlučně podnikatelské firmy, které stojí před určitým manažerským rozhodnutím a výsledky šetření jim mají v první řadě pomoci s konkrétními marketingovými úkoly (viz odstavec 4.1). Z tohoto důvodu zde dostávají prostor spíše metody vyvinuté pro manažerské rozhodování za rizika a nejistoty a logistická regrese hraje v tomto případě pouze okrajovou roli. Jedním z dalších zdůrazňovaných důvodů je malý zájem zadávajících institucí o průzkumy tohoto typu, které podle slov výzkumníků téměř vymizely, nevylučují však, že si je klienti provádí interně sami. Dalším a zároveň nejčastěji zmiňovaný důvod je podle nich fakt, že uživatelé statistických výstupů (pracovníci marketingových oddělení) mají jen malé povědomí o složitějších statistických metodách, mezi něž logistická regrese bezpochyby patří. Z tohoto důvodu hledají firmy jednodušší postupy pro řešení klasifikačních úloh, které by poskytovaly srozumitelnější a snáze interpretovatelné výstupy. 34

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE Testy dobré shody Vedoucí diplomové práce: RNDr. PhDr. Ivo

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

Matematická statistika

Matematická statistika Matematická statistika Daniel Husek Gymnázium Rožnov pod Radhoštěm, 8. A8 Dne 12. 12. 2010 v Rožnově pod Radhoštěm Osnova Strana 1) Úvod 3 2) Historie matematické statistiky 4 3) Základní pojmy matematické

Více

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem) MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY Učební osnova předmětu MATEMATIKA pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem) Schválilo Ministerstvo školství, mládeže a tělovýchovy dne 14.června

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Výsledky vstupních testů z matematiky a úspěšnost studia

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Výsledky vstupních testů z matematiky a úspěšnost studia Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky Bakalářská práce Výsledky vstupních testů z matematiky a úspěšnost studia Plzeň, 2014 Zuzana Rábová Prohlášení Prohlašuji, že

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Jana Vránová, 3. lékařská fakulta, UK Praha

Jana Vránová, 3. lékařská fakulta, UK Praha Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně

Více

Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky

Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky STUDIUM SOUVISLOSTÍ MEZI ÚSPĚŠNOSTÍ STUDIA MEDICÍNY, ZNÁMKAMI STUDENTŮ NA STŘEDNÍ ŠKOLE A VÝSLEDKY PŘIJÍMACÍCH ZKOUŠEK 1 Čestmír Štuka, Petr Šimeček Anotace Studie analyzuje úspěšnost studentů přijatých

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Úmrtnostní tabulky příjemců příspěvku na péči

Úmrtnostní tabulky příjemců příspěvku na péči Úmrtnostní tabulky příjemců příspěvku na péči Datum: listopad 2011 Verze: 2.2 Zadavatel: Aktivita č. 12 Autor: Jan Alexa 1 Jan Alexa vystudoval Přírodovědeckou fakultu University Karlovy a Fakultu sociálních

Více

Dynamické metody pro predikci rizika

Dynamické metody pro predikci rizika Dynamické metody pro predikci rizika 1 Úvod do analýzy časových řad Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých časových intervalech okamžikové např

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Drsná matematika IV 7. přednáška Jak na statistiku?

Drsná matematika IV 7. přednáška Jak na statistiku? Drsná matematika IV 7. přednáška Jak na statistiku? Jan Slovák Masarykova univerzita Fakulta informatiky 2. 4. 2012 Obsah přednášky 1 Literatura 2 Co je statistika? 3 Popisná statistika Míry polohy statistických

Více

Poznámky k předmětu Aplikovaná statistika, 9.téma

Poznámky k předmětu Aplikovaná statistika, 9.téma Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

MATEMATIKA Charakteristika vyučovacího předmětu 2. stupeň

MATEMATIKA Charakteristika vyučovacího předmětu 2. stupeň MATEMATIKA Charakteristika vyučovacího předmětu 2. stupeň Obsahové, časové a organizační vymezení Předmět Matematika se vyučuje jako samostatný předmět v 6. až 8. ročníku 4 hodiny týdně, v 9. ročníku 3

Více

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 530 VÝBĚR VZORKŮ

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 530 VÝBĚR VZORKŮ MEZINÁRODNÍ AUDITORSKÝ STANDARD VÝBĚR VZORKŮ (Účinný pro audity účetních závěrek sestavených za období počínající 15. prosincem 2009 nebo po tomto datu) OBSAH Odstavec Úvod Předmět standardu... 1 2 Datum

Více

Regresní analýza nehodovosti na světelně řízených křižovatkách

Regresní analýza nehodovosti na světelně řízených křižovatkách Regresní analýza nehodovosti na světelně řízených křižovatkách RNDr. Martin Hála, CSc. Abstract: Various statistical methods and tools were used and tested when analyzing traffic accidents. The main stress

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Využití matematického zpracování údajů o množstvi plynnovzdušné směsi získaných z monitoringu odplyňovacích vrtů

Využití matematického zpracování údajů o množstvi plynnovzdušné směsi získaných z monitoringu odplyňovacích vrtů Využití matematického zpracování údajů o množstvi plynnovzdušné směsi získaných z monitoringu odplyňovacích vrtů Iveta Cholovová 1 a Josef Mazáč 2 Utilizationof processing mathematic data on gas air mixtures

Více

Dodatek č. 3 ke školnímu vzdělávacímu programu. Strojírenství. (platné znění k 1. 9. 2009)

Dodatek č. 3 ke školnímu vzdělávacímu programu. Strojírenství. (platné znění k 1. 9. 2009) Střední průmyslová škola Jihlava tř. Legionářů 1572/3, Jihlava Dodatek č. 3 ke školnímu vzdělávacímu programu Strojírenství (platné znění k 1. 9. 09) Tento dodatek nabývá platnosti dne 1. 9. 13 (počínaje

Více

Základy matematické statistiky

Základy matematické statistiky r- MATEMATICKO-FYZIKÁLNí FAKULTA UNIVERZITY KARLOVY V PRAZE Jifí Andel Základy matematické statistiky matfyzpress PRAHA 2011 r I Obsah Predmluva. 11 1 Náhodné veličiny 1.1 Základní pojmy 1.2 Príklady diskrétních

Více

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2 Semestrální projekt do předmětu Statistika Vypracoval: Adam Mlejnek 2-36 Oponenti: Patrik Novotný 2-36 Jakub Nováček 2-36 Úvod Pro vypracování projektu do předmětu statistika jsem si zvolil průzkum kvality

Více

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj.

Více

KDO JE CHUDÝ A KDO JE BOHATÝ? CO VYPLÝVÁ Z DAT STATISTIKY RODINNÝCH ÚČTŮ

KDO JE CHUDÝ A KDO JE BOHATÝ? CO VYPLÝVÁ Z DAT STATISTIKY RODINNÝCH ÚČTŮ KDO JE CHUDÝ A KDO JE BOHATÝ? CO VYPLÝVÁ Z DAT STATISTIKY RODINNÝCH ÚČTŮ WHO ARE THE POOR AND WHO ARE THE RICH? WHAT CAN WE DERIVE FROM THE HOUSEHOLD BUDGET SURVEY Robert Jahoda Anotace Příspěvek se snaží

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.

Více

9. Úvod do teorie PDR

9. Úvod do teorie PDR 9. Úvod do teorie PDR A. Základní poznatky o soustavách ODR1 Diferenciální rovnici nazveme parciální, jestliže neznámá funkce závisí na dvou či více proměnných (příslušná rovnice tedy obsahuje parciální

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Kapitola 9 Skalární součin Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Definice 9.1 Je-li x = (x 1,..., x n ) T R n 1 reálný

Více

KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček

KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček (9.SLOVENSKÁ DEMOGRAFICKÁ KONFERENCIA RODINA, 17.-19.9.2003, Tajov pro Banskej Bystrici) 1 ÚVOD Při úlohách vztažených k analýze a prezentaci výsledků

Více

Vysoká škola technická a ekonomická v Českých Budějovicích. Institute of Technology And Business In České Budějovice

Vysoká škola technická a ekonomická v Českých Budějovicích. Institute of Technology And Business In České Budějovice MIKROEKONOMIE CHOVÁNÍ FIRMY A ODVOZENÍ NABÍDKY ELASTICITA NABÍDKY A POPTÁVKY Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice Tento učební

Více

Teoretická rozdělení

Teoretická rozdělení Teoretická rozdělení Diskrétní rozdělení Obsah kapitoly Studijní cíle Doba potřebná ke studiu Pojmy k zapamatování Úvod Některá teoretická rozdělení diskrétních veličin: Alternativní rozdělení Binomické

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 2.1 Tvorba lineárních regresních modelů při analýze dat Autor práce: Přednášející:

Více

SEIZMICKÝ EFEKT ŽELEZNIČNÍ DOPRAVY ÚVODNÍ STUDIE

SEIZMICKÝ EFEKT ŽELEZNIČNÍ DOPRAVY ÚVODNÍ STUDIE SEIZMICKÝ EFEKT ŽELEZNIČNÍ DOPAVY ÚVODNÍ STUDIE Josef Čejka 1 Abstract In spite of development of road transport, carriage by rail still keeps its significant position on traffic market. It assumes increases

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Rozhodovací stromy a lesy

Rozhodovací stromy a lesy Rozhodovací stromy a lesy Klára Komprdová Leden 2012 Příprava a vydání této publikace byly podporovány projektem ESF č. CZ.1.07/2.2.00/07.0318 Víceoborová inovace studia Matematické biologie a státním

Více

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR KORELACE A REGRESE 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/..00/8.001)

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE Náplní tohoto projektu byl prvotní průzkum, následné statistické zpracování dat a vyhodnocení. Data jsme získaly skrze internetový dotazník, který jsme rozeslaly

Více

PRAXE A PŘÍNOSY INDEXOVÉHO BENCHMARKINGU PRACTISE AND BENEFITS OF INDEX BENCHMARKING

PRAXE A PŘÍNOSY INDEXOVÉHO BENCHMARKINGU PRACTISE AND BENEFITS OF INDEX BENCHMARKING PRAXE A PŘÍNOSY INDEXOVÉHO BENCHMARKINGU PRACTISE AND BENEFITS OF INDEX BENCHMARKING Daniel Salava 1 Anotace: Tento článek se zabývá problematikou a aspekty užití indexového benchmarkingu zejména v malých

Více

Požadavky k opravným zkouškám z matematiky školní rok 2013-2014

Požadavky k opravným zkouškám z matematiky školní rok 2013-2014 Požadavky k opravným zkouškám z matematiky školní rok 2013-2014 1. ročník (první pololetí, druhé pololetí) 1) Množiny. Číselné obory N, Z, Q, I, R. 2) Absolutní hodnota reálného čísla, intervaly. 3) Procenta,

Více

Determinant. Definice determinantu. Permutace. Permutace, vlastnosti. Definice: Necht A = (a i,j ) R n,n je čtvercová matice.

Determinant. Definice determinantu. Permutace. Permutace, vlastnosti. Definice: Necht A = (a i,j ) R n,n je čtvercová matice. [] Definice determinantu BI-LIN, determinant, 9, P Olšák [2] Determinant je číslo jistým způsobem charakterizující čtvercovou matici det A 0 pro singulární matici, det A 0 pro regulární matici používá

Více

(n, m) (n, p) (p, m) (n, m)

(n, m) (n, p) (p, m) (n, m) 48 Vícerozměrná kalibrace Podobně jako jednorozměrná kalibrace i vícerozměrná kalibrace se používá především v analytické chemii Bude vysvětlena na příkladu spektroskopie: cílem je popis závislosti mezi

Více

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory Zkouška ověřuje znalost základních pojmů, porozumění teorii a schopnost aplikovat teorii při

Více

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity Tlumené kmit V praxi téměř vžd brání pohbu nějaká brzdicí síla, jejíž původ je v třecích silách mezi reálnými těles. Matematický popis těchto sil bývá dosti komplikovaný. Velmi často se vsktuje tzv. viskózní

Více

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami. Maticové operace Definice Skalár Představme si nějakou množinu, jejíž prvky lze sčítat a násobit. Pěkným vzorem jsou čísla, která už známe od mala. Prvky takové množiny nazýváme skaláry. Matice Matice

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Příloha P.1 Mapa větrných oblastí

Příloha P.1 Mapa větrných oblastí Příloha P.1 Mapa větrných oblastí P.1.1 Úvod Podle metodiky Eurokódů se velikost zatížení větrem odvozuje z výchozí hodnoty základní rychlosti větru, definované jako střední rychlost větru v intervalu

Více

ANALÝZA STRUKTURY A DIFERENCIACE MEZD ZAMĚSTNANCŮ EMPLOEE STRUCTURE ANALYSIS AND WAGE DIFFERENTIATION ANALYSIS

ANALÝZA STRUKTURY A DIFERENCIACE MEZD ZAMĚSTNANCŮ EMPLOEE STRUCTURE ANALYSIS AND WAGE DIFFERENTIATION ANALYSIS ANALÝZA STRUKTURY A DIFERENCIACE MEZD ZAMĚSTNANCŮ EMPLOEE STRUCTURE ANALYSIS AND WAGE DIFFERENTIATION ANALYSIS Pavel Tomšík, Stanislava Bartošová Abstrakt Příspěvek se zabývá analýzou struktury zaměstnanců

Více

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) doc. RNDr. PhMr. Karel

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION Lucie Váňová 1 Anotace: Článek pojednává o předpovídání délky kolony v křižovatce. Tato úloha je řešena v programu

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

VYMEZENÍ A POROVNÁNÍ PARAMETRŮ NÁVRHOVÉHO POMALÉHO VOZIDLA DLE NORMY ČSN 736101

VYMEZENÍ A POROVNÁNÍ PARAMETRŮ NÁVRHOVÉHO POMALÉHO VOZIDLA DLE NORMY ČSN 736101 VŠB-Technická univerzita Ostrava Fakulta stavební Studentská vědecká odborná činnost školní rok 2005-2006 VYMEZENÍ A POROVNÁNÍ PARAMETRŮ NÁVRHOVÉHO POMALÉHO VOZIDLA DLE NORMY ČSN 736101 Předkládá student

Více

Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita, spotřeba ovoce a zeleniny

Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita, spotřeba ovoce a zeleniny Aktuální informace Ústavu zdravotnických informací a statistiky České republiky Praha 22. 12. 2010 70 Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita,

Více

Finanční. matematika pro každého. f inance. 8. rozšířené vydání. věcné a matematické vysvětlení základních finančních pojmů

Finanční. matematika pro každého. f inance. 8. rozšířené vydání. věcné a matematické vysvětlení základních finančních pojmů Finanční matematika pro každého 8. rozšířené vydání J. Radová, P. Dvořák, J. Málek věcné a matematické vysvětlení základních finančních pojmů metody pro praktické rozhodování soukromých osob i podnikatelů

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Nezaměstnanost absolventů škol se středním a vyšším odborným vzděláním 2015. Mgr. Martin Úlovec

Nezaměstnanost absolventů škol se středním a vyšším odborným vzděláním 2015. Mgr. Martin Úlovec Nezaměstnanost absolventů škol se středním a vyšším odborným vzděláním 2015 Mgr. Martin Úlovec Praha 2015 1 OBSAH 1. Úvodní poznámky... 3 2. Nezaměstnanost absolventů škol a hospodářská krize... 4 3. Počty

Více

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Biostatistika a matematické metody epidemiologie- stručné studijní texty Biostatistika a matematické metody epidemiologie- stručné studijní texty Bohumír Procházka, SZÚ Praha 1 Co můžeme sledovat Pro charakteristiku nebo vlastnost, kterou chceme sledovat zvolíme termín jev.

Více

Gymnázium, Brno. Matice. Závěrečná maturitní práce. Jakub Juránek 4.A Školní rok 2010/11

Gymnázium, Brno. Matice. Závěrečná maturitní práce. Jakub Juránek 4.A Školní rok 2010/11 Gymnázium, Brno Matice Závěrečná maturitní práce Jakub Juránek 4.A Školní rok 2010/11 Konzultant: Mgr. Aleš Kobza Ph.D. Brno, 2011 Prohlášení Prohlašuji, že jsem předloženou práci zpracoval samostatně

Více

KOMPLEXNÍ ČÍSLA INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky

KOMPLEXNÍ ČÍSLA INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky KOMPLEXNÍ ČÍSLA Gymnázium Jiřího Wolkera v Prostějově Výukové materiály z matematiky pro vyšší gymnázia Autoři projektu Student na prahu 21. století - využití ICT ve vyučování matematiky na gymnáziu INVESTICE

Více

Pořízení licencí statistického SW

Pořízení licencí statistického SW Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ

Více

2 Spojité modely rozhodování

2 Spojité modely rozhodování 2 Spojité modely rozhodování Jak již víme z přednášky, diskrétní model rozhodování lze zapsat ve tvaru úlohy hodnocení variant: f(a i ) max, a i A = {a 1, a 2,... a p }, kde f je kriteriální funkce a A

Více

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY BAKALÁŘSKÁ PRÁCE Numerické metody jednorozměrné minimalizace Vedoucí bakalářské práce: RNDr. Horymír

Více

Matematika a ekonomické předměty

Matematika a ekonomické předměty Matematika a ekonomické předměty Bohuslav Sekerka, Soukromá vysoká škola ekonomických studií Praha Postavení matematiky ve výuce Zaměřím se na výuku matematiky, i když jsem si vědom, toho, že by měl být

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ FIGALA V. a), KAFKA V. b) a) VŠB-TU Ostrava, FMMI, katedra slévárenství, 17. listopadu 15, 708 33 b) RACIO&RACIO, Vnitřní

Více

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly Matice Matice typu (m, n) je uspořádaná m-tice prvků z řádky matice.. Jednotlivé složky této m-tice nazýváme Matice se zapisují Speciální typy matic Nulová matice všechny prvky matice jsou nulové Jednotková

Více

Lineární a logistická regrese

Lineární a logistická regrese Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

2.8 ZÁKLADY VYTVÁŘENÍ TESTOVÝCH SYSTÉMŮ

2.8 ZÁKLADY VYTVÁŘENÍ TESTOVÝCH SYSTÉMŮ 2.8 ZÁKLADY VYTVÁŘENÍ TESTOVÝCH SYSTÉMŮ Vytváření testových systémů pro jednotlivé potřeby tělovýchovné praxe patří mezi hlavní otázky teorie konstrukce testů. Protože však v testové baterii nebo profilu

Více

Kapitola 1. Logistická regrese. 1.1 Model

Kapitola 1. Logistická regrese. 1.1 Model Kapitola Logistická regrese Předpokládám, že už jsme zavedli základní pojmy jako rysy a že už máme nějaké značení Velkost trenovacich dat a pocet parametru Motivační povídání... jeden z nejpoužívanějších

Více

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Zpracoval: www.scio.cz, s.r.o. (15. 2. 2012) Datové podklady: výsledky a dotazníky z PRO23, test čtenářské gramotnosti, www.scio.cz, s.r.o.

Více

MATEMATICKÁ ANALÝZA A LINEÁRNÍ ALGEBRA PŘÍPRAVA NA ZKOUŠKU PRO SAMOUKY

MATEMATICKÁ ANALÝZA A LINEÁRNÍ ALGEBRA PŘÍPRAVA NA ZKOUŠKU PRO SAMOUKY MATEMATICKÁ ANALÝZA A LINEÁRNÍ ALGEBRA PŘÍPRAVA NA ZKOUŠKU PRO SAMOUKY POMNĚNKA prase Pomni, abys nezapomněl na Pomněnku MSc. Catherine Morris POMNĚNKA Verze ze dne: 14. října 01 Materiál je v aktuální

Více

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot Rozdělení Náhodná veličina Náhodná veličina je vyjádření výsledku náhodného pokusu číselnou hodnotou. Jde o reálnou funkci definovanou na množině. Rozdělení náhodné veličiny udává jakých hodnot a s jakou

Více

2. Chování spotřebitele: užitečnost a poptávka

2. Chování spotřebitele: užitečnost a poptávka 2. Chování spotřebitele: užitečnost a poptávka 2.1 Celkový užitek a mezní užitek Jedním ze základních problémů, které spotřebitel řeší, je, kolik určitého statku má kupovat a jak má svůj důchod mezi různé

Více

SEMINÁRNÍ PRÁCE ZE ZÁKLADŮ FIREMNÍCH FINANCÍ. Kalkulační propočty, řízení nákladů a kalkulační metody.

SEMINÁRNÍ PRÁCE ZE ZÁKLADŮ FIREMNÍCH FINANCÍ. Kalkulační propočty, řízení nákladů a kalkulační metody. SEMINÁRNÍ PRÁCE ZE ZÁKLADŮ FIREMNÍCH FINANCÍ Téma: Kalkulační propočty, řízení nákladů a kalkulační metody. Zpracoval(a): Dvořáková Hana Fojtíková Veronika Maříková Jana Datum prezentace: 21.dubna 2004

Více

OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA

OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA Tomáš Kocyan OBSAH PREZENTACE Představení výzkumu Popis analyzovaných dat Analýza Asociace Fundovaná implikace Interpretace výsledků Rozhodovací stromy Výběr atributů

Více

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1. 2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:

Více

1. Úvod do studia statistiky. 1.1. Významy pojmu statistika

1. Úvod do studia statistiky. 1.1. Významy pojmu statistika 1. Úvod do studia statistiky Andrew Lang o politikovi: Používá statistiku jako opilý člověk pouliční lampu spíš na podporu než na osvětlení. Benjamin Disraeli o lži: Jsou tri stupně lži - lež, nehanebná

Více

5. Maticová algebra, typy matic, inverzní matice, determinant.

5. Maticová algebra, typy matic, inverzní matice, determinant. 5. Maticová algebra, typy matic, inverzní matice, determinant. Matice Matice typu m,n je matice složená z n*m (m >= 1, n >= 1) reálných (komplexních) čísel uspořádaných do m řádků a n sloupců: R m,n (resp.

Více

Funkce zadané implicitně

Funkce zadané implicitně Kapitola 8 Funkce zadané implicitně Začneme několika příklady. Prvním je známá rovnice pro jednotkovou kružnici x 2 + y 2 1 = 0. Tato rovnice popisuje křivku, kterou si však nelze představit jako graf

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.

Více

Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS )

Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS ) LINEÁRNÍ ALGEBRA Úvod vektor Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS ) Kartézský souřadnicový systém -je taková soustava

Více

Zlatý řez nejen v matematice

Zlatý řez nejen v matematice Zlatý řez nejen v matematice Zlaté číslo a jeho vlastnosti In: Vlasta Chmelíková author): Zlatý řez nejen v matematice Czech) Praha: Katedra didaktiky matematiky MFF UK, 009 pp 7 Persistent URL: http://dmlcz/dmlcz/40079

Více

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích Firková, L. 1), Kafka, V. 2), Figala, V. 3), Herzán, M. 4), Nykodýmová, V. 5) 1) VŠB

Více

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny Ing. Jana Šenkapoulová VODÁRENSKÁ AKCIOVÁ SPOLEČNOST, a.s. Brno, Soběšická 156, 638 1 Brno ÚVOD Každé rekonstrukci

Více

Bayesovská klasifikace digitálních obrazů

Bayesovská klasifikace digitálních obrazů Výzkumný ústav geodetický, topografický a kartografický Bayesovská klasifikace digitálních obrazů Výzkumná zpráva č. 1168/2010 Lubomír Soukup prosinec 2010 1 Úvod V průběhu nedlouhého historického vývoje

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více