VÝCHODISKA A PŘÍSTUPY K VYUŽITÍ

Rozměr: px
Začít zobrazení ze stránky:

Download "VÝCHODISKA A PŘÍSTUPY K VYUŽITÍ"

Transkript

1 České vysoké učení technické v Praze FAKULTA ELEKTROTECHNICKÁ Katedra ekonomiky, manažerství a humanitních věd VÝCHODISKA A PŘÍSTUPY K VYUŽITÍ MATEMATICKÝCH METOD V MARKETINGU Odborná studie Doktorand: Mgr. Ing. David Vít Školitel: Prof. Ing. Gustav Tomek, DrSc. Rok odevzdání: 2012 Východiska a přístupy k využití exaktních metod v marketingu Stránka 1

2 Obsah OBSAH ÚVOD INFORMACE Z DOSTUPNÝCH ZDROJŮ Marketingová tržní segmentace Volba segmentačních kritérií Interpretace typu kritérií Modelování dat Shluková analýza Perspektivní metody shlukové analýzy Interpretace nalezených shluků Faktorová analýza Neuronové sítě a biologicky inspirované algoritmy Statistická analýza charakteristik vícerozměrných souborů Expertní systémy Strojové učení z kvalifikovaných příkladů NÁVRH STRUKTURY EXAKTNÍ METODY TRŽNÍ SEGMENTACE Kvantifikovaný datový soubor Volba typů kritérií, jejich kategorií a vah Faktorová analýza Volba množiny shlukovacích kritérií Test difúzní preference Test homogenní preference Shluková analýza Rozhodnutí o hloubce řezu Nalezení popisu shlukového rozkladu OSNOVA DISERTAČNÍ PRÁCE SHRNUTÍ A ZÁVĚR POUŽITÁ LITERATURA Východiska a přístupy k využití exaktních metod v marketingu Stránka 2

3 1. Úvod Tématem mé disertační práce je Využití exaktních metod v marketingu. Jeho úvodní motivací je kapitola o segmentaci trhu ve knize Marketing od myšlenky k realizaci, autorů pana prof. Tomka a paní doc. Vávrové. Zde byla jako možnost obecně použitelných exaktních metod na jednoduchém příkladu zmíněna shluková analýza dat, která patří mezi metody explorativní analýzy dat. Součástí zadání mé diplomové práce Využití shlukové analýzy v marketingu, obhájené v lednu 2010, bylo posoudit využitelnost a chování klasických statistických metod shlukové analýzy na vzorku dat marketingového dotazování tak, aby bylo možno získané výsledky aplikované metody shlukové analýzy interpretovat ve smyslu požadavků kladených na tržní segmenty podle Kotlera, který zdůrazňuje nutnost chápat tržní segment jako homogenní skupinu nakupujících, která sdílí stejný soubor potřeb, preferencí, požadavků a přání, takový, který je vnitřně homogenní a přitom dostatečně heterogenní vůči nakupujícím zařazených do jiných segmentů. Segment ostře odlišuje od sektoru, tvořeného rovněž homogenní skupinou nakupujících identifikovanou jinak než na základě obdobného souboru přání a potřeb. Pokud je provedena projekce některého sektorového rozkladu na takový rozklad daného trhu, velmi pravděpodobně nebudou například sektory vytvořené dle demografických či sociálně-ekonomických kritérií pozitivně korelovat se segmenty konstruovanými dle behaviorálních kritérií, například ne všechny ženy středního věku ze severních Čech rády navštěvují fitcentra. V typickém případě bude sektor podmnožinou původního cílového trhu s obdobnou preferenční strukturou, jako měl původní trh. Chápání tržních segmentů jako homogenních souborů nakupujících je plně v souladu s obecnými požadavky kladenými na tržní segmenty, tedy zejména dostatečnou definovatelností, požadující homogenní shluk poptávajících, který lze přesně a jednoznačně specifikovat, přitom s rozlišitelností, diferencující tento shluk od ostatních segmentů na daném trhu. Tyto požadavky determinují základní kritéria segmentace. Zbývající požadavky na měřitelnost, tedy možnost stanovení kvantitativních charakteristik trhu, dostatečnou velikost, umožňující generování dostatečného efektu, a přístupnost, chápanou jako efektivní dosažitelnost, jsou klíčovými faktory pro následný proces targetingu. Bohužel provedení tržní segmentace a následného targetingu ve smyslu Kotlerova pojetí je ve většině případů proces založený na intuici a hlubokých zkušenostech marketéra. Ačkoliv správně stanovené a zvolené tržní segmenty zásadním způsobem ovlivňují marketingovou strategii, nejsou v praxi rozšířené exaktní metody, které by tento proces automatizovaly a formalizovaly. Cílem disertační práce je detailní analýza problematiky procesu tržní segmentace, aplikace vhodných matematických a algoritmických metod, tak aby byl z kvantifikovaných dat primárního a sekundárního marketingového dotazování vytvořen formalizovaný model, který umožní exaktní přístup řešení a poskytne srovnatelné výstupy s intuitivními expertními přístupy marketérů. Východiska a přístupy k využití exaktních metod v marketingu Stránka 3

4 2. Informace z dostupných zdrojů Problematiku vymezenou cílem disertační práce lze rozdělit na tři logické oblasti. První oblastí je otázka interpretace vstupních dat pocházejících z marketingového dotazování tak, aby tato data reprezentovala klíčové vlastnosti z hlediska požadavků na tržní segmentaci, které současně nesou dostatečné množství informací. Druhou oblastí je vlastní metoda explorativní analýzy dat, která dokáže s akceptovatelnou spolehlivostí identifikovat shluky dat, jejichž charakteristiky vyhovují marketingovým požadavkům na tržní segmenty. Třetí oblastí je pak interpretace získaných výsledků a jejich projekce na popis příslušných tržních segmentů. Informace rozděluji do tematických celků podle jednotlivých metodik marketingová tržní segmentace, modelování dat, shluková analýza, faktorová analýza, neuronové sítě a biologicky inspirované algoritmy, statistická analýza charakteristik vícerozměrných datových souborů, expertní systémy a strojové učení z kvalifikovaných příkladů. 2.1 Marketingová tržní segmentace Obecně není zaručeno, že na zkoumaném cílovém trhu existuje nějaká přirozená struktura a tedy identifikovatelné tržní segmenty. V rámci procesu segmentace můžeme objevit následující typy preferencí: homogenní preference všichni zákazníci tohoto trhu mají zhruba stejnou strukturu požadavků a preferencí, neexistují zde žádné přirozené tržní segmenty, difúzní preference preference zákazníků jsou rozptýleny po celém prostoru určeném rozsahem hodnot jednotlivých sledovaných kritérií, spotřebitelé se od sebe sice liší svými požadavky, potřebami či preferencemi, nicméně neexistují žádné vyhraněné skupiny, a shlukové preference existují přirozené tržní segmenty reprezentující skupiny zákazníků s vyhraněnými preferencemi, které jsou výrazně odlišitelné od preferencí jiných rozdílně vyhraněných skupin zákazníků. Při použití exaktní metody je nutno mít na zřeteli výše uvedené možnosti a je nezbytné, aby se s nimi dokázala příslušná metoda algoritmicky korektně vypořádat. V opačném případě by byly chybně vytvořeny umělé segmenty, kde by byl buď nadhodnocen význam homogenity objektů v rámci jednoho segmentu, či podhodnocen význam heterogenity mezi více segmenty Volba segmentačních kritérií Segmentace probíhá ve dvou fázích nad podklady marketingového výzkumu a množinou segmentačních kritérií. V první fázi procesu jsou na základě vhodně zvolených kritérií identifikovány tržní segmenty, ve druhé fázi segmentace potom na základě jiné skupiny kritérií dochází k efektivnímu vymezení těchto segmentů tak, aby bylo pro dané segmenty možno snadno formulovat marketingovou strategii, která umožní tvorbu marketingového mixu. Existují dva základní přístupy k tržní segmentaci. První přístup je založen na základě analýzy behaviorálních aspektů, které korespondují se závislostmi subjektů cílového trhu vzhledem k přáním a potřebám. Takto nalezené segmenty jsou v dalším kroku rozlišeny dle popisných charakteristik. Tato fáze vyžaduje hluboké osobní zkušenosti a zejména intuici marketéra, protože Východiska a přístupy k využití exaktních metod v marketingu Stránka 4

5 obecně neexistuje jednoznačný způsob volby kritérií, která dokážou zachytit strukturu souboru potřeb a přání tak, jak se na konkrétním cílovém trhu vyskytuje. Druhý přístup vychází z analýzy popisných charakteristik, tedy dle segmentačních kritérií z kategorií geografických, demografických, sociálně ekonomických a psychografických kritérií, a následného zkoumání, zda v nalezených segmentech mají zákazníci obdobné požadavky a potřeby, které se liší od zákazníků v jiných segmentech. Výhodou tohoto přístupu je možnost využití sekundárního marketingového výzkumu představovaného různými komerčně dostupnými databázemi. Je tedy třeba rozhodnout, zda bude prováděna analýza behaviorálních aspektů či popisných charakteristik Interpretace typu kritérií Ze zvolené skupiny kritérií, která mají být využita pro identifikaci tržních segmentů, je třeba vybrat takovou podmnožinu, která nese dostatečnou informaci nezbytnou pro vytvoření hierarchického shlukového rozkladu. K tomu je nezbytné posoudit různé statistické charakteristiky a míru entropie daných kritérií. Po provedení všech předchozích kroků je možno přistoupit k vlastní analýze struktury datového souboru. Pro provedení segmentace je třeba rozhodnout o interpretaci typů jednotlivých kritérií vzhledem k citlivostní závislosti shlukovacích metod. Vzhledem k předpokládané segmentaci dle souboru preferencí a potřeb je nezbytné určit charakter kritérií, tedy kategorie kritérií. Pro B2C trhy se jedná o kritéria geografická, demografická, sociálně ekonomická, psychografická či behaviorální. Na B2B trzích je třeba rozlišit kategorie kritérií demografických, geografických, kritérií nákupních či situačních faktorů a osobních charakteristik. V závislosti na typu trhu B2C či B2B je třeba posoudit váhu jednotlivých kategorií na identifikaci marketingového segmentu. 2.2 Modelování dat V případě, kdy je pominuta ryzí intuice marketéra, je nezbytné při hledání tržních segmentů vyjít z měřitelných podkladů tak, aby bylo možno chápat procesy segmentace a targetingu za systematické postupy. Základní znalosti o trhu, preferencích zákazníků a jejich nákupním chování poskytuje správně provedený marketingový výzkum. Měřitelná data lze získat především prostřednictvím marketingového dotazování či jiných zdrojů ať primárních či sekundárních. Jakákoliv data udávající kvantitativní či kvalitativní preference nakupujících cílového trhu lze s větší či menší subjektivitou kvantifikovat do té míry, že je lze použít jako vstupní data některé exaktní matematické či statistické metody, případně nejprve provést vhodné transformace hodnot odpovědí na číselné hodnoty. Na výsledná data marketingového dotazování lze hledět jako na čistě statistická data a pro analýzu struktury získaného statistického souboru je možno použít metody a prostředky klasické shlukové analýzy, vytvářející rozklady statistických souborů podle míry vzájemné nepodobnosti objektů. Při maticové interpretaci vstupního datového souboru představují řádkové vektory matematické zápisy odpovědí jednotlivých respondentů, přičemž v jednotlivých sloupcích jsou uvedeny hodnoty příslušných statistických znaků pro všechny respondenty marketingového dotazování. Takto interpretovaný statistický soubor odpovědí lze chápat jako matematický model trhu a statistické shluky představují Východiska a přístupy k využití exaktních metod v marketingu Stránka 5

6 modely tržních segmentů. Mechanická aplikace vhodných shlukovacích metod však může identifikovat shlukový rozklad i v takovém statistickém souboru, který buď žádnou strukturu vůbec nemá, nebo obsahuje čistě náhodná data. Tato situace koresponduje s homogenní či difúzní preferencí na analyzovaném trhu. Velmi důležitá je otázka správné interpretace charakteru kritérií ve zpracovaných marketingových datech. Shlukovací metody na základě testů prováděných na empirických datech vykazují silnou citlivost na volbu typu kritérií. Jednotlivé typy kritérií použitých pro shlukování lze rozlišit na kvantitativní kritéria v intervalové a poměrové stupnici, ordinální, nominální a symetrická či asymetrická kritéria: kvantitativní obsahují číselné hodnoty v intervalové či poměrové stupnici. Kvantitativní data měřená v poměrové stupnici je před dalším zpracováním třeba nejprve pomocí logaritmické transformace převést do intervalové stupnice, ordinální číselné hodnoty lze sice uspořádat podobně jako u kvantitativních proměnných, nicméně tyto hodnoty nereprezentují žádný kvantitativní znak tak, aby bylo možno ohodnotit vzájemný rozdíl či poměr dvou hodnot. Při vhodně volené škále je samozřejmě možno mnoho kritérií ordinálního charakteru převést na kvantitativní proměnné (silný souhlas, souhlas, neutrální postoj, nesouhlas, silný nesouhlas). Zda má být konkrétní otázka marketingového dotazování spíše transformovaná na kvantitativní či ordinální proměnnou záleží zejména na konkrétní formulaci možných hodnot odpovědí na primární otázku v marketingovém dotazníku, nominální tyto proměnné diskrétně rozlišují jednotlivé odpovědi respondentů, nicméně neexistuje žádná přirozená interpretace uspořádání jednotlivých hodnot, například obor podnikání příslušné firmy. Takovýto typ otázek se velmi často vyskytuje v marketingových dotaznících, binární tyto proměnné nabývají pouze dvou hodnot, typicky ano/ne, souhlas/nesouhlas apod. Jsou speciálním případem nominálních proměnných, pokud je výskyt obou hodnot symetrický, nebo s uvážením možností asymetrického výskytu obou hodnot mohou být chápány jako speciální případ ordinálních proměnných. Jelikož mají tyto proměnné specifický charakter a z něj vyplývající metody zjišťování podobnosti, uvažujeme je jako samostatnou skupinu. Je třeba rozlišovat je na asymetrické, kdy má jedna z obou hodnot významnější výskyt než druhá, a symetrické, kdy je výskyt obou hodnot stejně významný. Správnou interpretaci charakteru zpracovávaných kritérií nelze zobecnit, jelikož vždy závisí na konkrétním analyzovaném trhu. Pokud se pro symetrické a asymetrické binární proměnné používají odlišné metody měření podobnosti, může takováto nesprávná interpretace opět podstatně zkreslit výsledné identifikované shluky a tedy celou strukturu analyzovaného trhu. Toto jsem empiricky ověřil na různých shlukovacích metodách. Změna interpretace kritérií jako nominálních či ordinálních nebo interpretace symetrie hodnot u binárních kritérií zásadně ovlivnila tvary výsledných shlukových rozkladů tak, že dokonce nebyla vyvrácena hypotéza nezávislosti takto identifikovaných shlukových rozkladů. Východiska a přístupy k využití exaktních metod v marketingu Stránka 6

7 2.3 Shluková analýza Pro shlukovou analýzu, která představuje jádro identifikace shluků v matematickém modelu, je k dispozici velká řada zdrojů, v nichž se informace redundantně opakují. Existují dva základní směry řešení tohoto problému, první představují klasické statistické metody, druhý modernější metody využívající neuronové sítě a další biologicky inspirované algoritmy. Jednotlivé metody jsou více či méně vhodné pro aplikace v různých oblastech. Specifické použití shlukové analýzy pro tržní segmentaci není v literatuře popsáno. Požadavky na vhodnou metodu jsou determinovány výše zmíněnými požadavky na tržní segment. Tyto požadavky jsou poměrně významné a kladou velká omezení na volbu vhodné metody. Vstupní data mají poměrně malý rozsah ve srovnání například s datovými soubory využitými pro hledání struktury informací v nestrukturovaných datech. Nezajímá nás rovněž kompletní shlukový rozklad a struktura datového souboru, ale nalezení takových shluků dat, které jsou vnitřně dostatečně homogenní, přitom dostatečně heterogenní navenek a zároveň mající dostatečnou velikost. Při hledání shluků nás tedy zajímá pouze omezený počet shluků, pokrývající dostatečnou část vstupního souboru, přitom nesmí být tyto shluky uměle sloučeny do jednoho pouze pro to, že by shluků bylo více než maximální počet. Naproti tomu velmi malý shluk, který je vnitřně velmi výrazně homogenní, může představovat model velmi atraktivního tržního mikrosegmentu, tedy tržního výklenku. Až na výjimky nejsou v literatuře u jednotlivých metod prezentovány empirické zkušenosti spojené s jejich chováním. V rámci diplomové práce a studijního bloku jsem se mimo jiné zaměřil na zkoumání empirického chování jednotlivých metod na vzorku dat malého marketingového dotazování. Aplikace shlukové analýzy ukazují v případě takovýchto dat vysokou citlivost na použitou metodu a případně použitou metriku či míru nepodobnosti. Pro testování jsem používal vlastní softwarový analytický nástroj původně navržený v rámci diplomové práce, analytické nástroje produktu Microsoft Excel a statistický analytický nástroj IBM SPSS. Ukazuje se, že většina popsaných metod shlukové analýzy má takové vlastnosti, které nezaručují takovou konzistenci výstupů, jaká je vyžadována omezeními stanovenými požadavky kladenými na tržní segmenty Perspektivní metody shlukové analýzy Optimalizační klasické metody, které jsou mimo jiné implementovány v nástroji IBM SPSS, neposkytly dle očekávání vyhovující výstupy. Jejich velmi silná závislost na poměrně jednoduché míře nepodobnosti ukazuje spolu s dosavadními empirickými výsledky na to, že nejde o vhodnou metodiku. Teoreticky velmi příznivé výsledky mohou přinášet hierarchické metody klasické shlukové analýzy, zde jsem se věnoval posouzení možné interpretaci jejich výsledů při jejich projekci na modelovaný trh, což je otázka spadající do třetí dílčí oblasti zmíněné problematiky. Mezi těmito metodami se jako nejvýhodnější zdají polytetické algoritmy, protože v každém shlukovacím kroku využívají míru nepodobnosti, která zohledňuje všechna kritéria. Podle mých dosavadních výsledků se však ukázalo, že polytetické algoritmy závisí velmi silně na kvantifikaci a normalizaci jednotlivých kritérií a nezachovávají sémantickou informaci o nepodobnosti. Identifikované segmenty se velmi obtížně interpretují. Naproti tomu monotetické algoritmy sémantickou informaci zachovávají velmi dobře. Pominu-li skutečnost, že se výsledky různých polytetických metod značně rozcházejí, je velmi Východiska a přístupy k využití exaktních metod v marketingu Stránka 7

8 obtížné definovat vhodnou míru nepodobnosti pro smíšená data, a tyto metody vykazují vysokou citlivost na míru nepodobnosti použitou k sestavení matice nepodobnosti. Proto je interpretace shlukových rozkladů vytvořených libovolnou polytetickou shlukovací metodou velmi problematická. Vzhledem k charakteru monotetického shlukování je interpretace nalezených shluků jako marketingových segmentů výrazně jednodušší. Základní optimalizační metoda k-průměrů silně závisí na pořadí objektů v datovém souboru, způsobu volby výchozích k centroidů, způsobu výpočtu polohy nového centroidu, jakož i na znalosti počtu hledaných shluků. Jde tedy o nedeterministickou metodu, která nalezne pouze lokálně optimální výsledek. Metoda k-průměrů pracuje s kvantitativními kritérii, nicméně byla navržena i její modifikace určená pro smíšená data, nazvaná metoda k-prototypů. V metodě k-prototypů je použita speciální míra nepodobnosti, která kombinuje kvadratickou Euklidovskou vzdálenost, použitou pro kvantitativní data, s mírou užívanou pro pouze kategoriální data v metodě k-modů, založené na koeficientu prostého nesouhlasu. Tento koeficient je definován jako poměr počtu proměnných, u nichž jsou u obou objektů rozdílné hodnoty, a celkového počtu proměnných Interpretace nalezených shluků Po zvolení optimálního shlukového rozkladu splňujícího požadavky dostatečné velikosti a dostatečné odlišitelnost, kladených na efektivní tržní segmenty je třeba vyhovět požadavku na přesnou definovanost. V případě analýzy dle behaviorálních aspektů je třeba použít druhé skupiny kritérií. U analýzy dle popisných kritérií je nejprve třeba rozhodnout, zda nalezené shluky na základě popisných kritérií vykazují obdobný soubor potřeb a preferencí, přičemž vlastní popis nalezených segmentů musí být proveden na základě popisných kritérií. Zde je tedy nezbytné před vlastním popisem posoudit, zda shluky reprezentují segmenty či sektory. Intuitivní přístup hledání popisu nalezených shluků spočívá v jejich projekci do datového souboru a hledání závislostí mezi objekty patřícími do téhož shluku a současně odlišností, které objekty z daného shluku dostatečně diferencují od objektů patřících do jiných shluků. Tento intuitivní postup v rámci návrhu exaktní metody pro tržní segmentaci formalizovat. Po nalezení jednoznačného popisu získaných segmentů byly splněny tři z pěti požadavků na efektivní tržní segmenty. Posouzení měřitelnosti a přístupnosti nalezených segmentů již záleží na marketérovi, který dokončí proces targetingu a v rámci positioningu může formulovat pro zvolené segmenty odpovídající strategii. 2.4 Faktorová analýza V rámci testování vzorových dat s produktem IBM SPSS byla posouzena i možnost aplikace faktorové analýzy při stanovování tržních segmentů. Hlavním cílem faktorové analýzy je hledání skrytých faktorů, které ovlivňují sledované proměnné datového souboru. Výsledkem je jednak zmenšení rozměru úlohy pro shlukovou analýzu v případě, kdy je použit velký počet kritérií, a dále pak nahrazení velkého počtu potenciálně skrytě korelovaných proměnných několika novými vzájemně buď vůbec nekorelovanými, případně málo korelovanými proměnnými faktory. V případě, že v datovém souboru jsou nalezeny vhodně interpretované nekorelované faktory, je Východiska a přístupy k využití exaktních metod v marketingu Stránka 8

9 možno tyto využít pro snazší popis nalezených shluků, tedy tržních segmentů. Velké množství behaviorálních preferenčních kritérií může být nahrazeno generickými kritérii, která danou množinu vzájemně korelovaných proměnných původního statistického souboru vzniklého na základě marketingového dotazníku lépe vystihují. Pro využití v marketingu při stanovení tržních segmentů může být faktorová analýza užitečná pro stanovení popisu nalezených shluků. Otázkou je, zda je vhodnější provést nejprve faktorovou analýzu datového souboru a zmenšit tak počet sledovaných proměnných a pracovat s transformovanými hodnotami nových proměnných, nebo provést shlukovou analýzu na původních skrytě korelovaných proměnných a získané shluky pak popsat pomocí hodnot faktorů jednotlivých objektů. Vzhledem k tomu, že pro optimální výsledky shlukové analýzy je nejvhodnější použít co nejmenší počet vzájemně nekorelovaných proměnných, ukazuje se jako jednoznačné východisko provést nejprve faktorovou analýzu původního souboru pocházejícího z marketingového dotazníku, tím zmenšit velikost úlohy na několik podstatných nekorelovaných proměnných, které bude následně možno použít pro popis nalezených shluků modelů tržních segmentů. Faktorová analýza vstupního souboru pocházejícího z marketingového dotazování představuje velmi slibný metodický nástroj na vytvoření konzistentních generických kritérií, které jednak zjednoduší a současně zpřesní shlukovou analýzu na těchto datech tak, že identifikované shluky budou konzistentní a zejména bude zjednodušena jejich následná interpretace. Pokud je provedena faktorová analýza skrytých faktorů, lze na základě identifikované závislosti jednotlivých proměnných na daných faktorech zkonstruovat projekcí přes faktorové rovnice popis shluků, který využije pouze ty proměnné deskriptivní kategorie, které významně závisí na daných faktorech. Tím se proces interpretace identifikovaných shluků značně zjednoduší. V případě, že je faktorová analýza provedena před vlastní shlukovou analýzou a je nalezena vhodná rotace shluků, která se blíží jednoduché struktuře faktorů, pracuje vlastní shluková analýza s již velmi homogenizovanými daty. Jestliže je navíc pro tyto společné faktory nalezena smysluplná a jednoznačná identifikace, jsou na základě výsledku shlukové analýzy získané shluky přímo jednoduše popsatelné. Mezi hlavní zmiňované nedostatky faktorové analýzy patří nejednoznačnost řešení, kdy interpretace faktorů záleží na normování hodnot proměnných a volbě korelační či kovarianční matice. Korelační matice se používá v případě proměnných, které mají různá měřítka. 2.5 Neuronové sítě a biologicky inspirované algoritmy Alternativou klasických metod shlukové analýzy jsou biologicky inspirované algoritmy, zejména metody založené na umělých neuronových sítích. Z velké nabídky dosud popsaných modelů umělých neuronových sítí je třeba se zaměřit na ty z metod, které jsou obecně vhodné pro explorační analýzu dat. Základní model umělé neuronové sítě vhodné pro využití ve shlukové analýze představují Kohonenovy samoorganizující mapy (self-organizing map), patřící mezi modely neuronové sítě s učením bez učitele. Svým chování připomínají klasickou optimalizační metodu k- průměrů (k-means) shlukové analýzy. Další metodiky biologických algoritmů zahrnují například neuronový plyn, konkurenční Hebbovské učení a genetické algoritmy. Aplikace umělých neuronových sítí představují velmi atraktivní oblast výzkumu Východiska a přístupy k využití exaktních metod v marketingu Stránka 9

10 v mnoha oborech včetně explorační analýzy dat. Pokud je explorační analýza dat použita v marketingové tržní segmentaci, musí být v úvahu bráno chování jednotlivých metod, charakter a podmínky kladené na hledané shluky, aby jejich následná interpretace skutečně vyjadřovala hledané vztahy a souvislosti mezi reálnými objekty. Kohonenova samoorganizující mapa je jednovrstvá umělá neuronová síť, která umožňuje vizualizovat topografii a hierarchickou strukturu multidimenzionálních dat transformací do prostoru nižší dimenze (tzv. komprese dat). Ve výkonné vrstvě existuje mřížka neuronů s danou topologií (obvykle hexagonální nebo čtvercovou), počet jejích vstupů odpovídá dimenzi vstupního počtu proměnných vstupního datového souboru, váhy vstupů neuronů vycházejí z předložených vstupních objektů a přenosová funkce představuje kvadratickou Euklidovskou vzdálenost. Postupným učením jsou nalezeny referenční vektory, tj. neurony, které fakticky představují reprezentanty nalezených shluků. Při použití pro tržní segmentaci existuje velmi striktní omezení na maximální počet hledaných shluků, nesmí jít o více než jednotky shluků. V případě, kdy se použije Kohonenova samoorganizující mapa s větším počtem neuronů než je počet očekávaných shluků, není možno transformovaná data dále agregovat do menšího počtu shluků. Získáme sice transformovaný dvojrozměrný obraz vícedimenzionálního vstupního souboru, ale ztrácíme veškeré informace o jeho struktuře. Z tohoto hlediska poskytuje tato umělá neuronová síť mnohem menší množství informací než využití klasických hierarchických shlukovacích metod. Je možno vizualizovat Euklidovskou vzdálenost mezi vzory referenčních vektorů mřížky mapy, nicméně není zřejmé, jak tyto shluky vypadají a jak se k sobě blíží. Pro jednotlivé objekty je sice k dispozici hodnota chyby vzhledem k referenčnímu vektoru, ale nelze zjistit, jaká je tato chyba vzhledem k referenčním vektorům sousedních shluků, resp. objektům sousedních shluků. Referenční vektory při trénování mapy větších rozměrů mají navíc tendenci rozmisťovat se po okraji mapy. Srovná-li se centroid získaný optimalizační klasickou metodou k-průměrů s referenčním vektorem Kohonenovy samoorganizující mapy, je zřejmé, že centroid podle zvolené metody výpočtu mnohem lépe vystihuje polohu shluku vzhledem k okolním shlukům. Sice by bylo možno redukovat velikost původního datového souboru pomocí Kohonenovy samoorganizující mapy větší dimenze a potom v dalším kroku dvoukrokové shlukové analýzy pracovat pouze se vzory referenčních vektorů, nicméně vzor referenčního vektoru jako reprezentanta shluku je méně přesný než centroid určený pomocí klasické optimalizační metody k-průměrů, resp. k-prototypů. Tato systematická chyba nejvíce ovlivnila rozdílnost shluků vytvořených pomocí metody k-průměrů a Kohonenovy samoorganizující mapy. Metoda k-prototypů je závislá na volbě hodnoty jedné empirické konstanty v průběhu iterací, podobně jako metoda k-průměrů není deterministická, neboť závisí na pořadí objektů ve vstupním datovém souboru, avšak její implementace v IBM SPSS v19 se chová z hlediska nalezení shlukového rozkladu velmi stabilně. Naproti tomu Kohonenova samoorganizující mapa závisí na volbě topologie mřížky, tvaru okolí, velikosti mřížky, požadovanému učícímu kroku, způsobu inicializace vstupních vektorů a počtu iterací. Ačkoliv bylo dosaženo shodných výsledků při opakovaných pokusech, u některých tvarů mřížky a počtů iterací docházelo k překroucení mřížky, které vyžadovalo opakované trénování mapy. Největší vliv na proces trénování mapy má Východiska a přístupy k využití exaktních metod v marketingu Stránka 10

11 úvodní inicializace vektorů mřížky, která vychází z náhodného nastavení a je zcela nedeterministická. Z tohoto hlediska se v případě Kohonenovy samoorganizující mapy nejedná o stabilní shlukovací metodu. Doba trénování Kohonenovy samoorganizující mapy implementované v balíku SOM_PAK 3.1 byla navíc více než řádově delší ve srovnání s výpočtem metody k- průměrů v produktu IBM SPSS v19, tedy i z tohoto hlediska se jeví méně vhodná zejména při dílčím zpracování větších datových souborů, pro které je výhodné využívat optimalizační shlukovací metody typu k-prototypů či k-průměrů. Ačkoliv tedy lze Kohonenovy samoorganizující mapy obecně využít pro shlukovou analýzu, jejich vlastnosti nejsou pro aplikaci v tržní segmentaci výhodné a nepřináší žádná pozitivní vylepšení oproti klasickým shlukovacím metodám. Lze tedy souhlasit se závěry, že v situaci, kdy existuje specifický algoritmus pro řešení konkrétního problému, tato umělá neuronová síť neposkytuje vhodnější výpočetní aparát. Při hledání velkého počtu shluků ve velkých vstupních datových souborech se potom Kohonenova samoorganizující mapa blíží chování metody k-průměrů. 2.6 Statistická analýza charakteristik vícerozměrných souborů Metody shlukové analýzy mohou poskytnout relevantní výsledky pouze na trhu, kde existují přirozené tržní segmenty a existuje jeho jistá struktura. Před vlastní shlukovou analýzou je tedy nezbytné vyloučit situaci, kdy mají zákazníci na trhu homogenní nebo difúzní preference, respektive platí analogická rozložení objektů při analýze dle popisných charakteristik. Detekce homogenní preference lze provést poměrně jednoduše, protože by ve statistickém souboru mělo být zjistitelné normální Gaussovo rozdělení, s tím, že může být střední hodnota posunuta v rámci rozsahu hodnot jednotlivých kritérií. Pro odhalení této preference v rámci jednotlivých kritérií lze použít standardní test dobré shody při neznámých parametrech teoretického statistického rozdělení. Pro efektivní testování normality rozdělení zkoumaného statistického souboru lze teoreticky provést pomocí některé míry nepodobnosti absolutně vztažené ke střední hodnotě vícerozměrného statistického souboru. Případně lze zjišťovat shodu s vícerozměrným Gaussovým rozdělením některou metodou vícerozměrné statistické analýzy. Velmi složitá je detekce difúzní preference, kdy jsou jednotliví zákazníci podle svých potřeb a přání náhodně rozmístěni po celém trhu. Pro detekci lze využít testy absence struktury, jejichž podstatou je testování metodou Monte Carlo pro následující testy: hypotéza náhodné polohy, vícemodální nulová hypotéza a model náhodné matice nepodobnosti. Jakmile byla vyloučena existence homogenní či difúzní preference na daném trhu, je možno aplikovat vhodnou hierarchickou shlukovací metodu. Vzhledem k následné interpretaci identifikovaných segmentů se v rámci empirických testů nejlépe osvědčila monotetická divizivní hierarchická shlukovací metoda MONA. Při alternativním použití polytetické míry nepodobnosti mezi objekty založené na Gowerově koeficientu, který se využívá u polytetické aglomerativní hierarchické shlukovací metody AGNES, je velmi obtížné interpretovat identifikované shluky jako marketingové segmenty. Použitím hierarchické shlukovací metody je získána hierarchická shluková struktura datového souboru, tu lze názorně graficky zobrazit pomocí dendrogramu, který je zakreslen jako binární strom, zaznamenávající úrovně slučování či rozkladu jednotlivých podshluků v průběhu iterací algoritmu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 11

12 Dalším problémem je rozhodnutí, v jaké hloubce hierarchického rozkladu má být proveden řez. Toto lze intuitivně na základě zkušenosti stanovit prohlížení dendrogramu, avšak je problematické tento postup formalizovat. Vzhledem k návaznému procesu targetingu je třeba zvážit požadavky dostatečné velikosti a měřitelnosti tržních segmentů tak, aby pro ně bylo možno stanovit vhodnou marketingovou strategii. Ukazuje se, že efektivní počet shluků v datovém souboru pocházejícím z marketingového dotazování by neměl být pravděpodobně větší než zhruba pět až deset shluků, neboť existence desítek segmentů dostatečné velikosti není na cílovém trhu příliš pravděpodobná. Existence jediného shluku byla již předem vyloučena při detekci homogenní preference. Pro posouzení kvality shlukového rozkladu z hlediska konzistence, tedy posouzení vnitřní homogenity a vnější heterogenity je nezbytné zjistit různé popisné charakteristiky daného vícerozměrného rozdělení, posoudit střední hodnoty, rozptyly apod., jejich relativní vztah mezi shluky, vzhledem k celému vstupnímu souboru, a rozhodnout zda shlukový rozklad vykazuje akceptovatelné hodnoty vzhledem k požadavkům kladeným na tržní segmenty. 2.7 Expertní systémy Expertní systémy představují poměrně dobře zpracovanou oblast umělé inteligence. Existuje několik základních přístupů pro realizaci diagnostických expertních systémů, první je založen na znalostní bázi, inferenčním mechanizmu a vysvětlovacím modulu zde existuje mnoho různě sofistikovaných algoritmů, které se souhrnně označují jako pravidlové diagnostické modely využívající povrchových znalostí. Další možnosti zahrnují neuronové, genetické či fuzzy expertní systémy. Neuronové expertní systémy jsou založeny na principu neuronové sítě s učením s učitelem. Pro exaktní metodiku marketingové tržní segmentace je třeba formalizovat intuitivní postup zkušeného marketéra v oblasti volby segmentačních kritérií, hledání optimální hloubky řezu dendrogramu, pokud budou v rámci shlukování využity metody hierarchické shlukovací analýzy, a posouzení kvality shlukového rozkladu. Pro tento účel je vhodné použít pravidlový expertní systém využívající heuristických povrchových znalostí, přičemž je nezbytné zohlednit váhu jednotlivých použitých informací například ve formě pseudobayesovského modelu. Rozhodovací pravidla expertního systému pak budou definována na základě heuristik založených na statistikách vycházejících z jednotlivých kritérií vstupního datového souboru, jejich typů, kategorií a vah. Je tedy nutné identifikovat vhodné heuristiky. 2.8 Strojové učení z kvalifikovaných příkladů V případě, kdy je k dispozici pravděpodobný optimální shlukový rozklad vyhovující požadavkům na tržní segmentaci, je nutné vzniklé shluky vhodně popsat pomocí souboru kritérií popisných charakteristik tak, aby nalezené segmenty splňovaly požadavek na jednoznačnou definovanost. Pro exaktní realizaci těchto úloh lze využít strojové učení z kvalifikovaných příkladů. K dispozici je seznam objektů popsaných souborem popisných kritérií a znalost jejich příslušností do jednotlivých shluků, tedy pro každý shluk jsou známy množiny pozitivních a negativních příkladů. Při těchto předpokladech lze například aplikovat algoritmus AQ, který na základě těchto vstupních dat dokáže specifikovat na Východiska a přístupy k využití exaktních metod v marketingu Stránka 12

13 výstupu produkční pravidla, která pro každý shluk definují podle jeho popisných kritérií maximální generalizaci, tj. nejobecnější popis, který zaručuje pro analyzované objekty příslušnost daného objektu a současně vylučuje začlenění objektu nesplňujícího tento popis do daného shluku. Produkční pravidla vygenerovaná algoritmem AQ tvoří nejobecnější popis daných shluků a jsou faktickým popisem efektivních tržních segmentů. Aplikací výše popsané exaktní metody je možno ze zadaných dat pocházejících z marketingového dotazovaní či jiných zdrojů identifikovat a následně popsat efektivně využitelné tržní segmenty. V algoritmu AQ se využívá pro volbu nejvhodnějšího popisu preferenční kritérium, které v rámci sestavování výsledného popisu vybírá ten nejlepší z množiny alternativních popisů. Volba popisných atributů přednostně používaných pro vytváření popisů by měla vycházet z vah jednotlivých kritérií zadaných uživatelem na vstupu ve druhém kroku algoritmu navrhované exaktní metody. Volba vhodné heuristiky pro stanovení preferenčního kritéria algoritmu AQ je otázkou dalšího výzkumu. 3. Návrh struktury exaktní metody tržní segmentace Na základě shromážděných informací jsem provedl strukturaci celé problematiky tržní segmentace a následného targetingu tak, aby celá metoda odpovídala struktuře procesu, který je možno algoritmicky realizovat. Návrh obecné metody je zaměřen na analýzu dle behaviorálních aspektů s tím, že v případě analýzy dle popisných charakteristik by bylo nezbytné před nalezením popisu posoudit, zda identifikované shluky vykazují vnitřní homogenitu vzhledem k souboru behaviorálních kritérií a tedy, zda se jedná o segmenty či sektory. Návrh schématu metody je zobrazen na obrázku 1. Východiska a přístupy k využití exaktních metod v marketingu Stránka 13

14 Obrázek 1. Východiska a přístupy k využití exaktních metod v marketingu Stránka 14

15 3.1 Kvantifikovaný datový soubor Algoritmus očekává následující vstupy, které musí zajistit uživatel. Nejprve je třeba zadat vlastní datový soubor s kvantifikovanými kritérii po provedení nezbytných transformací. Možnostem interpretací kritérií a jejich transformacím jsem se věnoval v rámci diplomové práce. V tomto kroku dojde k transformaci výsledků původního dotazníku do matematické formy a vzniká vlastní model. 3.2 Volba typů kritérií, jejich kategorií a vah Volba typů kritérií, jejich kategorie a vah má velký dopad na výsledný shlukový rozklad. V dalším kroku musí uživatel specifikovat jednotlivé typy kritérií a jejich rozdělení do kategorií s případným empirickým stanovením jejich vah. Je nezbytné stanovit správnou kategorii kritéria, tedy zda se jedná o behaviorální či popisné kritérium, a určit jeho typ. V rámci empirických testů jsem si ověřil, že shlukovací algoritmy mají vysokou citlivost na volbu typu kritéria. Volitelně je možno stanovit rovněž váhu daného kritéria tak, aby byl zohledněn jeho vliv na průběh procesu segmentace a targetingu. V tomto okamžiku jsou zadány všechny požadované informace. 3.3 Faktorová analýza Jak jsem uvedl, faktorová analýza představuje vhodný prostředek pro zjednodušení množiny kritérií, podle nichž se bude shlukovat. Jednak je zde možnost vyloučení vlivu duplicitních a závislých kritérií a dále lze vytvořit generická kritéria typu citlivost na cenu, citlivost na kvalitu, citlivost na design apod. Faktorová analýza by měla být provedena odděleně na množině behaviorálních a na množině popisných kritérií, aby nedošlo k jejich nežádoucí provázanosti. Interpretace generických faktorů je velmi problematická, teoreticky by měla být řešitelná rozšířením o pravidlový expertní systém, nicméně vytvoření příslušné znalostní báze pro takovýto expertní systém je velmi problematické. Podstatnou výhodou snížení počtu kritérií v obou kategoriích je snazší nalezení vhodného popisu identifikovaných segmentů. 3.4 Volba množiny shlukovacích kritérií V následujícím kroku je nezbytné zajistit výběr vhodných kritérií pro vlastní shlukování. Volba by měla být provedena především z kritérií behaviorálních kategorií s možností doplnění o zajímavá popisná kritéria. V současné době tato volba závisí zejména na intuici a osobních zkušenostech, z důvodu algoritmické formalizace lze tuto úlohu realizovat ve formě dedikovaného diagnostického expertního systému. Ve formě pravidel lze formalizovat různé kombinace charakteristik dané množiny kritérií, váhy, rozptyly, statistická rozdělení jednotlivých kritérií, korelace s jinými kritérii apod. V případě použití generických faktorů po předchozí faktorové analýze lze pracovat s menším počtem kritérií a pravidla bude možno jednodušeji formulovat. 3.5 Test difúzní preference Po rozhodnutí o výběru vhodné množiny kritérií použitých pro shlukování je nutno vyloučit existenci difúzní preference v datovém souboru. Jak bylo vysvětleno ve Východiska a přístupy k využití exaktních metod v marketingu Stránka 15

16 shrnutí informací z dostupných zdrojů, pro tyto testy lze využít simulaci pomocí metody Monte Carlo a testy hypotézy náhodné polohy, vícemodální nulové hypotézy a model náhodné matice nepodobnosti. Jedná se o aplikaci různých statistických hypotéz v datovém souboru. Pokud nejsou tyto hypotézy zamítnuty, je proces ukončen se závěrem, že v modelu se vyskytuje difúzní preference. Hledání shlukového rozkladu by v takovémto případě bylo zbytečné, protože by se jednalo o uměle vytvořené shluky, které by nevyhověly požadavkům na tržní segmenty. 3.6 Test homogenní preference Jestliže je zamítnuta možnost difúzní preference, je nezbytné posoudit, zda se v daném datovém souboru nevyskytuje homogenní preference. Možné způsoby otestování této hypotézy byly rovněž naznačeny v kapitole věnované informacím z dostupných zdrojů. Jedná se o aplikaci několika vhodných testů jednorozměrné a vícerozměrné statistické analýzy. Po vyloučení homogenní preference lze použít předpoklad existence shlukové struktury a je možno přistoupit k provedení vlastní shlukové analýzy. V opačném případě je proces ukončen se závěrem, že datový model má homogenní preferenci. Nalezený shlukový rozklad by byl rovněž v tomto případě umělý a nesplňoval by požadavky kladené na tržní segmenty. 3.7 Shluková analýza V případě datového souboru velkého rozsahu je možno aplikovat algoritmy dvoukrokového shlukování, kdy v prvním kroku je zkomprimován rozsah dat pomocí optimalizačního shlukovacího algoritmu metody k-prototypů. Zredukovaný datový soubor je pak následně zpracován pomocí monotetického divizivního hierarchického algoritmu MONA, případně jiného vhodného algoritmu, který bude vhodně uchovávat sémantickou konzistenci vzhledem k homogenitě identifikovaného shluku. Výhodou hierarchických algoritmů je ta skutečnost, že jsou deterministické a nevyžadují žádné odhady počtu shluků, což může u souborů menších rozsahů výrazně ovlivnit výsledný shlukový rozklad. Je rovněž nutné zachovat informaci o počtu identických vektorů ve vstupním souboru. Výsledkem shlukování je znalost kompletní hierarchické struktury datového souboru, kdy musíme rozhodnout, který shlukový rozklad je optimální vzhledem k požadavkům na tržní segmenty. 3.8 Rozhodnutí o hloubce řezu Pro stanovení shlukového rozkladu, který by odpovídal modelu efektivních tržních segmentů na daném cílovém trhu, je nezbytné stanovit hloubku, v níž dojde v rámci vytvořeného dendrogramu k řezu. Pro způsoby hledání optimální hloubky existují různá empirická pravidla a testy, jejichž přímé aplikování na empiricky získaná data se neosvědčilo. Jelikož zatím jedinou možností pro řešení této úlohy je aplikace intuice a zkušeností, je třeba pro exaktní řešení této úlohy analogicky využít pravidlový pseudobayesovský expertní systém, podobně jako v dílčí úloze rozhodnutí o vhodné množině kritérií použitých pro shlukování, tedy fakticky volby efektivních segmentačních kritérií. Jednotlivé heuristiky pravidel tohoto expertního systému mohou být definovány na základě rozsáhlejší analýzy různých empirických datových souborů. Primárně je nutné posoudit konzistenci shlukového rozkladu, zejména vnitřní Východiska a přístupy k využití exaktních metod v marketingu Stránka 16

17 homogenitu shluků, vnější heterogenitu mezi shluky a počty shluků v daném rozkladu a jejich velikosti a tvary. 3.9 Nalezení popisu shlukového rozkladu Po předchozím kroku má již algoritmus znalost pravděpodobného optimálního shlukového rozkladu reprezentujícího model efektivních tržních segmentů. Zbývá pouze úloha vzniklé shluky vhodně popsat pomocí souboru kritérií popisných charakteristik tak, aby nalezené segmenty splňovaly požadavek na jednoznačnou definovanost. Jak jsem uvedl v kapitole věnované informacím z dostupných zdrojů, představuje vhodnou metodiku pro řešení tohoto dílčího problému aplikace strojového učení z kvalifikovaných příkladů. Algoritmus AQ je schopen specifikovat produkční pravidla, která definují podle jeho popisných kritérií nejobecnější popis efektivních tržních segmentů podle popisných kritérií. Tento popis zajistí jednoznačné zařazení či nezařazení daného objektu do příslušného shluku. Pokud byla v rámci procesu provedena faktorová analýza, máme na konci zpracování algoritmu k dispozici specifikaci shluků podle behaviorálních i popisných generických kritérií. V případě, že generickým kritériím dodáme vhodnou interpretaci, máme k dispozici vytvořený model tržní segmentace na základě daného marketingového dotazování s tím, že jsme schopni tento model popsat obecnými behaviorálními nebo popisnými kritérii. 4. Osnova disertační práce Disertační práce bude uvedena teoretickou částí obsahující výchozí poznatky spolu s diskusí k jejich přínosu, detailně rozvine návrh struktury exaktní metody tržní segmentace, zhodnotí její praktické využití a shrne přínosy a závěry celé práce. Bude mít následující osnovu: 1. Úvod a záměr práce 2. Segmentace a targeting v marketingu a jejich význam 3. Problematika modelování dat marketingových dotazníků 4. Analýza konzistence kritérií 5. Shluková analýza a její využitelnost v marketingu 6. Faktorová analýza a její využitelnost v marketingu 7. Analýza konzistence shlukového rozkladu 8. Expertní systémy a jejich využitelnost v marketingu 9. Strojové učení z kvalifikovaných příkladů a jeho využitelnost v marketingu 10. Exaktní metoda tržní segmentace a její implementace 11. Praktické výsledky exaktní metody 12. Závěr a zhodnocení přínosů práce Analýza konzistence kritérií bude zahrnovat návrh vhodných heuristických pravidel pseudobayesovských expertních systémů pro volbu optimální množiny kritérií využitých pro aplikaci shlukové analýzy na datovém souboru. Analýza konzistence shlukového rozkladu bude analogicky zahrnovat návrh vhodných heuristických pravidel pro stanovení optimální hloubky řezu nalezeného shlukového rozkladu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 17

18 5. Shrnutí a závěr Cílem této odborné studie bylo shrnout dosavadní poznatky a výsledky ze studijní etapy doktorského studia, které jsou využitelné pro vypracování disertační práce s tématem Využití exaktních metod v marketingu. V rámci zpřesnění zadání bych se chtěl zaměřit na shrnutí teoretického aparátu, který je potřebný pro precizaci návrhu exaktní metody tržní segmentace. Deklarovaným účelem exaktní metody tržní segmentace je vytvoření algoritmického postupu, který by byl v rámci disertační práce implementován a prakticky vyzkoušen. Výstupem této metody by měl být model tržní segmentace popsaný pomocí popisných i behaviorálních kritérií, který by měl být deterministický, měl by poskytnout optimální, či lokálně optimální řešení takové, které bude odborně porovnatelné s intuitivně provedenou tržní segmentací. Na základě vymezených oblastí byla navržena kostra takovéto exaktní metody, umožňující z kvantifikovaných dat marketingového dotazování získat formální popis vymezující dané tržní segmenty pomocí popisných charakteristik. Navržená metoda formalizuje intuitivní postup, používaný při aplikaci shlukové analýzy na kvantifikovaných marketingových datech. Dlouhodobým cílem disertační práce je takové rozpracování exaktní metody pro stanovení tržních segmentů, které umožní její softwarovou implementaci na úrovni, která by umožnila praktické využití v rámci tvorby marketingových strategií výrobních a obchodních organizací. Disertační práce vypracovaná podle tohoto návrhu by tedy měla být přínosem pro následné praktické využití v marketingu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 18

19 Použitá literatura DARREN, K., MALLERY, P. SPSS for Windows Step-by-Step: A Simple Guide and Reference, 10.0 Update (3rd Edition). Prentice Hall 2000 Electronic Statistics Textbook [online]. Tulsa: StatSoft Dostupný z WWW: EVERITT, B.S., LANDAU, S., LEESE, M. Cluster analysis, 4th edition. London: Arnold, a member of the Hodder Headline Group 2001 HEBÁK, P., HUSTOPECKÝ, J., PECÁKOVÁ, I., PRŮŠA, M., ŘEZANKOVÁ, H., SVOBODOVÁ, A., VLACH, P. Vícerozměrné statistické metody (3). Praha: Informatorium 2006 CHEN, N., MARQUES, N.C. An Extension of Self-Organizing Maps to Categorical Data [online]. Caparica: Universidade Nova de Lisboa. Dostupný z WWW: KOHONEN, T. Self-Organizing Maps. Berlin: Springer-Verlag 1995 KOHONEN, T., HYNNINEN, J., KANGAS, J., LAAKSONEN, J. SOM_PAK The Self- Organizing Map Program Package Version 3.1 [online]. Helsinki: Helsinki University of Technology Dostupný z WWW: KOTLER, P., KELLER, K. L. Marketing management, 12. vydání. Prague: Grada Publishing 2007 MAŘÍK, V., ŠTĚPÁNKOVÁ, O., LAŽANSKÝ, J. et al. Umělá inteligence (1), Prague: Academia 1993 MAŘÍK, V., ŠTĚPÁNKOVÁ, O., LAŽANSKÝ, J. et al. Umělá inteligence (2), Prague: Academia 1997 PALLANT, J. SPSS Survival Manual, 3rd Edition. Maidenhead: Open University Press 2007 ŘEZANKOVÁ, H., HÚSEK, D., SNÁŠEL, V. Shluková analýza dat. Prague: Professional Publishing 2007 ŠNOREK, M. Neuronové sítě a neuropočítače. Praha: Vydavatelství ČVUT 2004 TOMEK, G., VÁVROVÁ, V. Marketing od myšlenky k realizaci. Prague: Professional Publishing 2008 VÍT, D. Interpretation of monothetic and polythetic clustering method results for marketing questionaire processing : paper draft for Acta Polytechnica. Prague: CTU FEE Word Document. Unpublished. Východiska a přístupy k využití exaktních metod v marketingu Stránka 19

20 VÍT, D. Aplikace nástroje PASW SPSS 18.0 Base v tržní segmentaci: seminar thesis. Prague: CTU FEE Word Document. Unpublished. VÍT, D. Kohonenova samoorganizující mapa a její aplikace v marketingu. Prague: CTU FEE Word Document. Unpublished. VÍT, D. Exact Approach to Market Segments Determination. In POSTER Proceedings of the 14th International Conference on Electrical Engineering [CD-ROM]. Praha: ČVUT v Praze, FEL, 2010 VÍT, D. Využití shlukové analýzy v marketingu: master thesis, Prague: CTU Faculty of electrical engineering 2009 VÍT, D. Vliv marketingového dotazování na identifikaci tržních segmentů. Prague: Marketing & komunikace. 2009, roč. XIX, č. 4, s XU, R., WUNSCH, D.C. Clustering. Piscataway: IEEE Press 2007 ZHEXUE, H. Clustering large data sets with mixed numeric and categorical values. In Lu Hongjun, Motoda Hiroshi, Liu Huan (eds), Proceedings of the 1st Pacific-Asia Conference on Knowledge Discovery & Data Mining. Singapore, World Scientific (1997) Východiska a přístupy k využití exaktních metod v marketingu Stránka 20

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Státnice odborné č. 20

Státnice odborné č. 20 Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Ing. Alena Šafrová Drášilová, Ph.D.

Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování??? video Obsah typy rozhodování principy rozhodování rozhodovací fáze základní pojmy hodnotícího procesu rozhodovací podmínky rozhodování v podmínkách

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Otázky ke státní závěrečné zkoušce

Otázky ke státní závěrečné zkoušce Otázky ke státní závěrečné zkoušce obor Ekonometrie a operační výzkum a) Diskrétní modely, Simulace, Nelineární programování. b) Teorie rozhodování, Teorie her. c) Ekonometrie. Otázka č. 1 a) Úlohy konvexního

Více

Algoritmy pro shlukování prostorových dat

Algoritmy pro shlukování prostorových dat Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň

Více

OSA. maximalizace minimalizace 1/22

OSA. maximalizace minimalizace 1/22 OSA Systémová analýza metodika používaná k navrhování a racionalizaci systémů v podmínkách neurčitosti vyšší stupeň operační analýzy Operační analýza (výzkum) soubor metod umožňující řešit rozhodovací,

Více

Hodnocení kvality logistických procesů

Hodnocení kvality logistických procesů Téma 5. Hodnocení kvality logistických procesů Kvalitu logistických procesů nelze vyjádřit absolutně (nelze ji měřit přímo), nýbrž relativně porovnáním Hodnoty těchto znaků někdo buď předem stanovil (norma,

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

VYUŽITÍ SHLUKOVÉ ANALÝZY V MARKETINGU. České vysoké učení technické v Praze FAKULTA ELEKTROTECHNICKÁ Katedra ekonomiky, manažerství a humanitních věd

VYUŽITÍ SHLUKOVÉ ANALÝZY V MARKETINGU. České vysoké učení technické v Praze FAKULTA ELEKTROTECHNICKÁ Katedra ekonomiky, manažerství a humanitních věd České vysoké učení technické v Praze FAKULTA ELEKTROTECHNICKÁ Katedra ekonomiky, manažerství a humanitních věd VYUŽITÍ SHLUKOVÉ ANALÝZY V MARKETINGU Diplomová práce Diplomant: Mgr. David Vít Vedoucí diplomové

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR 1 aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické

Více

Segmentace návštěvníků

Segmentace návštěvníků angl. visitor segmentation je marketingový proces v cestovním ruchu, ve kterém se potenciální návštěvníci rozdělují do stejnorodých, avšak od sebe se lišících skupin, dle určitých kritérií tvořící tzv.

Více

Základní informace o co se jedná a k čemu to slouží

Základní informace o co se jedná a k čemu to slouží Základní informace o co se jedná a k čemu to slouží založené na relačních databází transakční systémy, které jsou určeny pro pořizování a ukládání dat v reálném čase (ERP, účetní, ekonomické a další podnikové

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

KOMUNIKACE A LIDSKÉ ZDROJE

KOMUNIKACE A LIDSKÉ ZDROJE PROJEKT BAKALÁŘSKÉ PRÁCE KOMUNIKACE A LIDSKÉ ZDROJE NÁZEV BAKALÁŘSKÉ PRÁCE Marketingová strategie obchodní jednotky (SBU) společnosti ABB v oblasti B2B Leden 2013 TERMÍN UKONČENÍ STUDIA A OBHAJOBA (MĚSÍC/ROK)

Více

Cvičná bakalářská zkouška, 1. varianta

Cvičná bakalářská zkouška, 1. varianta jméno: studijní obor: PřF BIMAT počet listů(včetně tohoto): 1 2 3 4 5 celkem Cvičná bakalářská zkouška, 1. varianta 1. Matematická analýza Najdětelokálníextrémyfunkce f(x,y)=e 4(x y) x2 y 2. 2. Lineární

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU vyučující doc. RNDr. Jiří Zháněl, Dr. M I 4 Metodologie I 7. ANALÝZA DAT (KVANTITATIVNÍ VÝZKUM) (MATEMATICKÁ) STATISTIKA DESKRIPTIVNÍ (popisná) ANALYTICKÁ

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Vícerozměrné statistické rozdělení

Více

UČENÍ BEZ UČITELE. Václav Hlaváč

UČENÍ BEZ UČITELE. Václav Hlaváč UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Podobnosti a vzdálenosti ve vícerozměrném prostoru, asociační matice II Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Práce s asociační maticí Vzdálenosti

Více

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Hledání optimální polohy stanic a zastávek na tratích regionálního významu Hledání optimální polohy stanic a zastávek na tratích regionálního významu Václav Novotný 31. 10. 2018 Anotace 1. Dopravní obsluha území tratěmi regionálního významu 2. Cíle výzkumu a algoritmus práce

Více

coachpage.cz MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování ve vztahu ke koupi automobilu TOOLS for SUCCESS in TODAY s BUSINESS

coachpage.cz MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování ve vztahu ke koupi automobilu TOOLS for SUCCESS in TODAY s BUSINESS coachpage.cz TOOLS for SUCCESS in TODAY s BUSINESS MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování Faktory ovlivňující nákupní chování Hlavní cíl výzkumného projektu Výzkumný projekt si klade za

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

STATISTICKÉ PROGRAMY

STATISTICKÉ PROGRAMY Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

VOLBA SAMOSTATNÉHO CENTRÁLNÍHO ÚTVARU LOGISTIKY VE VÝROBNÍM PODNIKU

VOLBA SAMOSTATNÉHO CENTRÁLNÍHO ÚTVARU LOGISTIKY VE VÝROBNÍM PODNIKU VOLBA SAMOSTATNÉHO CENTRÁLNÍHO ÚTVARU LOGISTIKY VE VÝROBNÍM PODNIKU THE CHOICE OF AN INDEPENDENT CENTRAL LOGISTICS DEPARTMENT IN A MANUFACTURING COMPANY Stanislav Koutný 1 Anotace: V rámci příprav na širší

Více

GIS Geografické informační systémy

GIS Geografické informační systémy GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu

Více

Cílený marketing proces STP

Cílený marketing proces STP Cílený marketing proces STP Segmentation(segmentace) Targeting(tržní cílení) Positioning(tržníumisťov ování) Ing. Lucie Vokáčov ová, vokacova@pef pef.czu.cz Marketingové přístupy k trhu z hlediska tržní

Více

1. ZÁVAZNÉ PŘEDMĚTY. Ekonomická teorie. Matematicko statistické metody v ekonomii 2. POVINNĚ VOLITELNÉ PŘEDMĚTY

1. ZÁVAZNÉ PŘEDMĚTY. Ekonomická teorie. Matematicko statistické metody v ekonomii 2. POVINNĚ VOLITELNÉ PŘEDMĚTY SLEZSKÁ UNIVERZITA V OPAVĚ OBCHODNĚ PODNIKATELSKÁ FAKULTA V KARVINÉ ÚSTAV DOKTORSKÝCH STUDIÍ 1. ZÁVAZNÉ PŘEDMĚTY Ekonomická teorie Matematicko statistické metody v ekonomii 2. POVINNĚ VOLITELNÉ PŘEDMĚTY

Více

Marketingové aplikace. Doc. Ing.Vladimír Chalupský, CSc., MBA

Marketingové aplikace. Doc. Ing.Vladimír Chalupský, CSc., MBA Marketingové aplikace Doc. Ing.Vladimír Chalupský, CSc., MBA Struktura předmětu 4. okruh: Marketingový výzkum - vymezení podstaty a účelu marketingového výzkumu - požadavky na informace výzkumu - proces

Více

1. Statistická analýza dat Jak vznikají informace Rozložení dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat 1. Statistická analýza dat Jak vznikají informace Rozložení dat J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Význam statistické analýzy dat Sběr a vyhodnocování dat je způsobem k uchopení a pochopení

Více

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291 Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Shluková analýza Shluková analýza je souhrnným názvem pro celou řadu výpočetních algoritmů, jejichž cílem

Více

Pecharova 10, 146 20 PRAHA 4 Tel.: 222 135 544, Fax: 222 135 545 E-Mail: INBOX@MARKENT.CZ

Pecharova 10, 146 20 PRAHA 4 Tel.: 222 135 544, Fax: 222 135 545 E-Mail: INBOX@MARKENT.CZ E-BUSINESS V PODNIKOVÉ SFÉŘE PŘEHLED VÝSLEDKŮ VÝZKUMU Pecharova 1, 146 PRAHA 4 Tel.: 135 544, Fax: 135 545 E-Mail: INBOX@MARKENT.CZ Říjen 1 O č i, které vidí víc Markent, s.r.o., je společnost specializovaná

Více

Shluková analýza dat a stanovení počtu shluků

Shluková analýza dat a stanovení počtu shluků Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

OPONENTSKÝ POSUDEK HABILITAČNÍ PRÁCE

OPONENTSKÝ POSUDEK HABILITAČNÍ PRÁCE OPONENTSKÝ POSUDEK HABILITAČNÍ PRÁCE Habilitant: Téma habilitační práce: Oponent: Ing. Andrej Trnka, PhD. Inovatívne marketingové metódy analýzy onlinového nákupného správania Prof. Ing. Jaroslav Světlík,

Více

Mark tingový výzkum. Téma. Marketingový výzkum. Realizace. Tomek - Vávrová Katedra ekonomiky, manažerství a humanitních věd FEL-ČVUT Y16MVY

Mark tingový výzkum. Téma. Marketingový výzkum. Realizace. Tomek - Vávrová Katedra ekonomiky, manažerství a humanitních věd FEL-ČVUT Y16MVY Marketingový výzkum Realizace Tomek - Vávrová YMVY Proces marketingového výzkumu Návrh projektu výzkumu Stanovení zdrojů a způsobu získávání informací Sběr informací Vyhodnocení výzkumu a interpretace

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Seminář k absolventské práci

Seminář k absolventské práci Seminář k absolventské práci Jak napsat a úspěšně obhájit absolventskou práci Absolventské práce - závěrečná práce studia - významný čin z hlediska celkového růstu intelektuálních zdatností a tvůrčích

Více

Analytické metody v motorsportu

Analytické metody v motorsportu Analytické metody v motorsportu Bronislav Růžička školitel : Doc. Ing. Ivan Mazůrek, CSc. Ústav konstruování Odbor konstruování strojů Fakulta strojního inženýrství Vysoké učení technické v Brně 12.listopadu

Více

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických

Více

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN - P11 Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova

Více

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází 1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA)

METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA) Regionální rada regionu soudržnosti Moravskoslezsko METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA) verze 4.00 Tento metodický pokyn je zpracován v návaznosti na přílohu

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Rosenblattův perceptron

Rosenblattův perceptron Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného

Více

GIS Geografické informační systémy

GIS Geografické informační systémy GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu

Více

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

5. Umělé neuronové sítě. Neuronové sítě

5. Umělé neuronové sítě. Neuronové sítě Neuronové sítě Přesný algoritmus práce přírodních neuronových systémů není doposud znám. Přesto experimentální výsledky na modelech těchto systémů dávají dnes velmi slibné výsledky. Tyto systémy, včetně

Více

Modifikace algoritmu FEKM

Modifikace algoritmu FEKM Modifikace algoritmu FEKM Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 9. 14. září 2012 Němčičky Motivace Potřeba metod

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Název Autor Vedoucí práce Oponent práce

Název Autor Vedoucí práce Oponent práce POSUDEK BAKALÁŘSKÉ / MAGISTERSKÉ PRÁCE VEDOUCÍ PRÁCE Název Autor Vedoucí práce Oponent práce Preference uživatelů marihuany: indoor versus outdoor Veronika Havlíčková Ing. Jiří Vopravil, Ph.D. Mgr. Jaroslav

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.

Více

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Základní pojmy a cíle statistiky Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Statistika Pojmy a cíle

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární

Více

7 Regresní modely v analýze přežití

7 Regresní modely v analýze přežití 7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce

Více

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2 Výpočet transformačních koeficinetů vybraných 2D transformací Jan Ježek červen 2008 Obsah Odvození transformačního klíče vybraných 2D transformací 2 Meto vyrovnání 2 2 Obecné vyjádření lineárních 2D transformací

Více

METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA)

METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA) Regionální rada regionu soudržnosti Moravskoslezsko METODICKÝ POKYN PRO ZPRACOVÁNÍ STUDIE PROVEDITELNOSTI A EKONOMICKÉ ANALÝZY (CBA) verze 4.03 Evidence změn Verze Platnost od Předmět změny Strany č. 4.01

Více

odlehlých hodnot pomocí algoritmu k-means

odlehlých hodnot pomocí algoritmu k-means Chybějící a odlehlé hodnoty; odstranění odlehlých hodnot pomocí algoritmu k-means Návod ke druhému cvičení Matěj Holec, holecmat@fel.cvut.cz ZS 2011/2012 Úvod Cílem cvičení je připomenout důležitost předzpracování

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké

Více

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH Jindřich Kaluža Ludmila Kalužová Recenzenti: prof. Ing. Milan Turčáni, CSc. prof. Ing. Ivan Vrana, DrSc. Tato kniha vznikla za finanční podpory Studentské grantové

Více

Měření dat Filtrace dat, Kalmanův filtr

Měření dat Filtrace dat, Kalmanův filtr Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-03-21 16:45 Obsah

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních

Více

Vysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky. Metodické listy pro předmět ŘÍZENÍ PODNIKU 2

Vysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky. Metodické listy pro předmět ŘÍZENÍ PODNIKU 2 Vysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky Metodické listy pro předmět ŘÍZENÍ PODNIKU 2 Studium předmětu umožní studentům základní orientaci v procesech, které

Více

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma Multidimenzionální pohled na zdravotnické prostředí INMED - 21.11.2003 Petr Tůma Koncepce multid pohledu Poskytování péče probíhá v multidimenzionálním světě; dimenze tento svět mapují podobně jako souřadnice

Více

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II Faktorová analýza PSY252 Statistická analýza dat v psychologii II 8.12.2010 Latentní a manifestní proměnné Perspektiva CTT: (pro)jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška

Více

MODERNÍ MARKETINGOVÝ VÝZKUM

MODERNÍ MARKETINGOVÝ VÝZKUM KOZEL Roman MODERNÍ MARKETINGOVÝ VÝZKUM Obsah O hlavním autorovi... 9 Slovo úvodem...11 1. Marketingové prostředí...13 1.1 Charakteristika prostředí...14 1.2 Makroprostředí...16 1.2.1 Demografické prostředí...18

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools Analyst Pack je desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních

Více

Samoučící se neuronová síť - SOM, Kohonenovy mapy

Samoučící se neuronová síť - SOM, Kohonenovy mapy Samoučící se neuronová síť - SOM, Kohonenovy mapy Antonín Vojáček, 14 Květen, 2006-10:33 Měření a regulace Samoorganizující neuronové sítě s učením bez učitele jsou stále více využívány pro rozlišení,

Více

Změna hodnoty pozice v důsledku změn tržních cen.

Změna hodnoty pozice v důsledku změn tržních cen. Tržní riziko Změna hodnoty pozice v důsledku změn tržních cen. Akciové riziko Měnové riziko Komoditní riziko Úrokové riziko Odvozená rizika... riz. volatility, riz. korelace Pozice (saldo hodnoty očekávaných

Více