VÝCHODISKA A PŘÍSTUPY K VYUŽITÍ

Transkript

1 České vysoké učení technické v Praze FAKULTA ELEKTROTECHNICKÁ Katedra ekonomiky, manažerství a humanitních věd VÝCHODISKA A PŘÍSTUPY K VYUŽITÍ MATEMATICKÝCH METOD V MARKETINGU Odborná studie Doktorand: Mgr. Ing. David Vít Školitel: Prof. Ing. Gustav Tomek, DrSc. Rok odevzdání: 2012 Východiska a přístupy k využití exaktních metod v marketingu Stránka 1

2 Obsah OBSAH ÚVOD INFORMACE Z DOSTUPNÝCH ZDROJŮ Marketingová tržní segmentace Volba segmentačních kritérií Interpretace typu kritérií Modelování dat Shluková analýza Perspektivní metody shlukové analýzy Interpretace nalezených shluků Faktorová analýza Neuronové sítě a biologicky inspirované algoritmy Statistická analýza charakteristik vícerozměrných souborů Expertní systémy Strojové učení z kvalifikovaných příkladů NÁVRH STRUKTURY EXAKTNÍ METODY TRŽNÍ SEGMENTACE Kvantifikovaný datový soubor Volba typů kritérií, jejich kategorií a vah Faktorová analýza Volba množiny shlukovacích kritérií Test difúzní preference Test homogenní preference Shluková analýza Rozhodnutí o hloubce řezu Nalezení popisu shlukového rozkladu OSNOVA DISERTAČNÍ PRÁCE SHRNUTÍ A ZÁVĚR POUŽITÁ LITERATURA Východiska a přístupy k využití exaktních metod v marketingu Stránka 2

3 1. Úvod Tématem mé disertační práce je Využití exaktních metod v marketingu. Jeho úvodní motivací je kapitola o segmentaci trhu ve knize Marketing od myšlenky k realizaci, autorů pana prof. Tomka a paní doc. Vávrové. Zde byla jako možnost obecně použitelných exaktních metod na jednoduchém příkladu zmíněna shluková analýza dat, která patří mezi metody explorativní analýzy dat. Součástí zadání mé diplomové práce Využití shlukové analýzy v marketingu, obhájené v lednu 2010, bylo posoudit využitelnost a chování klasických statistických metod shlukové analýzy na vzorku dat marketingového dotazování tak, aby bylo možno získané výsledky aplikované metody shlukové analýzy interpretovat ve smyslu požadavků kladených na tržní segmenty podle Kotlera, který zdůrazňuje nutnost chápat tržní segment jako homogenní skupinu nakupujících, která sdílí stejný soubor potřeb, preferencí, požadavků a přání, takový, který je vnitřně homogenní a přitom dostatečně heterogenní vůči nakupujícím zařazených do jiných segmentů. Segment ostře odlišuje od sektoru, tvořeného rovněž homogenní skupinou nakupujících identifikovanou jinak než na základě obdobného souboru přání a potřeb. Pokud je provedena projekce některého sektorového rozkladu na takový rozklad daného trhu, velmi pravděpodobně nebudou například sektory vytvořené dle demografických či sociálně-ekonomických kritérií pozitivně korelovat se segmenty konstruovanými dle behaviorálních kritérií, například ne všechny ženy středního věku ze severních Čech rády navštěvují fitcentra. V typickém případě bude sektor podmnožinou původního cílového trhu s obdobnou preferenční strukturou, jako měl původní trh. Chápání tržních segmentů jako homogenních souborů nakupujících je plně v souladu s obecnými požadavky kladenými na tržní segmenty, tedy zejména dostatečnou definovatelností, požadující homogenní shluk poptávajících, který lze přesně a jednoznačně specifikovat, přitom s rozlišitelností, diferencující tento shluk od ostatních segmentů na daném trhu. Tyto požadavky determinují základní kritéria segmentace. Zbývající požadavky na měřitelnost, tedy možnost stanovení kvantitativních charakteristik trhu, dostatečnou velikost, umožňující generování dostatečného efektu, a přístupnost, chápanou jako efektivní dosažitelnost, jsou klíčovými faktory pro následný proces targetingu. Bohužel provedení tržní segmentace a následného targetingu ve smyslu Kotlerova pojetí je ve většině případů proces založený na intuici a hlubokých zkušenostech marketéra. Ačkoliv správně stanovené a zvolené tržní segmenty zásadním způsobem ovlivňují marketingovou strategii, nejsou v praxi rozšířené exaktní metody, které by tento proces automatizovaly a formalizovaly. Cílem disertační práce je detailní analýza problematiky procesu tržní segmentace, aplikace vhodných matematických a algoritmických metod, tak aby byl z kvantifikovaných dat primárního a sekundárního marketingového dotazování vytvořen formalizovaný model, který umožní exaktní přístup řešení a poskytne srovnatelné výstupy s intuitivními expertními přístupy marketérů. Východiska a přístupy k využití exaktních metod v marketingu Stránka 3

4 2. Informace z dostupných zdrojů Problematiku vymezenou cílem disertační práce lze rozdělit na tři logické oblasti. První oblastí je otázka interpretace vstupních dat pocházejících z marketingového dotazování tak, aby tato data reprezentovala klíčové vlastnosti z hlediska požadavků na tržní segmentaci, které současně nesou dostatečné množství informací. Druhou oblastí je vlastní metoda explorativní analýzy dat, která dokáže s akceptovatelnou spolehlivostí identifikovat shluky dat, jejichž charakteristiky vyhovují marketingovým požadavkům na tržní segmenty. Třetí oblastí je pak interpretace získaných výsledků a jejich projekce na popis příslušných tržních segmentů. Informace rozděluji do tematických celků podle jednotlivých metodik marketingová tržní segmentace, modelování dat, shluková analýza, faktorová analýza, neuronové sítě a biologicky inspirované algoritmy, statistická analýza charakteristik vícerozměrných datových souborů, expertní systémy a strojové učení z kvalifikovaných příkladů. 2.1 Marketingová tržní segmentace Obecně není zaručeno, že na zkoumaném cílovém trhu existuje nějaká přirozená struktura a tedy identifikovatelné tržní segmenty. V rámci procesu segmentace můžeme objevit následující typy preferencí: homogenní preference všichni zákazníci tohoto trhu mají zhruba stejnou strukturu požadavků a preferencí, neexistují zde žádné přirozené tržní segmenty, difúzní preference preference zákazníků jsou rozptýleny po celém prostoru určeném rozsahem hodnot jednotlivých sledovaných kritérií, spotřebitelé se od sebe sice liší svými požadavky, potřebami či preferencemi, nicméně neexistují žádné vyhraněné skupiny, a shlukové preference existují přirozené tržní segmenty reprezentující skupiny zákazníků s vyhraněnými preferencemi, které jsou výrazně odlišitelné od preferencí jiných rozdílně vyhraněných skupin zákazníků. Při použití exaktní metody je nutno mít na zřeteli výše uvedené možnosti a je nezbytné, aby se s nimi dokázala příslušná metoda algoritmicky korektně vypořádat. V opačném případě by byly chybně vytvořeny umělé segmenty, kde by byl buď nadhodnocen význam homogenity objektů v rámci jednoho segmentu, či podhodnocen význam heterogenity mezi více segmenty Volba segmentačních kritérií Segmentace probíhá ve dvou fázích nad podklady marketingového výzkumu a množinou segmentačních kritérií. V první fázi procesu jsou na základě vhodně zvolených kritérií identifikovány tržní segmenty, ve druhé fázi segmentace potom na základě jiné skupiny kritérií dochází k efektivnímu vymezení těchto segmentů tak, aby bylo pro dané segmenty možno snadno formulovat marketingovou strategii, která umožní tvorbu marketingového mixu. Existují dva základní přístupy k tržní segmentaci. První přístup je založen na základě analýzy behaviorálních aspektů, které korespondují se závislostmi subjektů cílového trhu vzhledem k přáním a potřebám. Takto nalezené segmenty jsou v dalším kroku rozlišeny dle popisných charakteristik. Tato fáze vyžaduje hluboké osobní zkušenosti a zejména intuici marketéra, protože Východiska a přístupy k využití exaktních metod v marketingu Stránka 4

5 obecně neexistuje jednoznačný způsob volby kritérií, která dokážou zachytit strukturu souboru potřeb a přání tak, jak se na konkrétním cílovém trhu vyskytuje. Druhý přístup vychází z analýzy popisných charakteristik, tedy dle segmentačních kritérií z kategorií geografických, demografických, sociálně ekonomických a psychografických kritérií, a následného zkoumání, zda v nalezených segmentech mají zákazníci obdobné požadavky a potřeby, které se liší od zákazníků v jiných segmentech. Výhodou tohoto přístupu je možnost využití sekundárního marketingového výzkumu představovaného různými komerčně dostupnými databázemi. Je tedy třeba rozhodnout, zda bude prováděna analýza behaviorálních aspektů či popisných charakteristik Interpretace typu kritérií Ze zvolené skupiny kritérií, která mají být využita pro identifikaci tržních segmentů, je třeba vybrat takovou podmnožinu, která nese dostatečnou informaci nezbytnou pro vytvoření hierarchického shlukového rozkladu. K tomu je nezbytné posoudit různé statistické charakteristiky a míru entropie daných kritérií. Po provedení všech předchozích kroků je možno přistoupit k vlastní analýze struktury datového souboru. Pro provedení segmentace je třeba rozhodnout o interpretaci typů jednotlivých kritérií vzhledem k citlivostní závislosti shlukovacích metod. Vzhledem k předpokládané segmentaci dle souboru preferencí a potřeb je nezbytné určit charakter kritérií, tedy kategorie kritérií. Pro B2C trhy se jedná o kritéria geografická, demografická, sociálně ekonomická, psychografická či behaviorální. Na B2B trzích je třeba rozlišit kategorie kritérií demografických, geografických, kritérií nákupních či situačních faktorů a osobních charakteristik. V závislosti na typu trhu B2C či B2B je třeba posoudit váhu jednotlivých kategorií na identifikaci marketingového segmentu. 2.2 Modelování dat V případě, kdy je pominuta ryzí intuice marketéra, je nezbytné při hledání tržních segmentů vyjít z měřitelných podkladů tak, aby bylo možno chápat procesy segmentace a targetingu za systematické postupy. Základní znalosti o trhu, preferencích zákazníků a jejich nákupním chování poskytuje správně provedený marketingový výzkum. Měřitelná data lze získat především prostřednictvím marketingového dotazování či jiných zdrojů ať primárních či sekundárních. Jakákoliv data udávající kvantitativní či kvalitativní preference nakupujících cílového trhu lze s větší či menší subjektivitou kvantifikovat do té míry, že je lze použít jako vstupní data některé exaktní matematické či statistické metody, případně nejprve provést vhodné transformace hodnot odpovědí na číselné hodnoty. Na výsledná data marketingového dotazování lze hledět jako na čistě statistická data a pro analýzu struktury získaného statistického souboru je možno použít metody a prostředky klasické shlukové analýzy, vytvářející rozklady statistických souborů podle míry vzájemné nepodobnosti objektů. Při maticové interpretaci vstupního datového souboru představují řádkové vektory matematické zápisy odpovědí jednotlivých respondentů, přičemž v jednotlivých sloupcích jsou uvedeny hodnoty příslušných statistických znaků pro všechny respondenty marketingového dotazování. Takto interpretovaný statistický soubor odpovědí lze chápat jako matematický model trhu a statistické shluky představují Východiska a přístupy k využití exaktních metod v marketingu Stránka 5

6 modely tržních segmentů. Mechanická aplikace vhodných shlukovacích metod však může identifikovat shlukový rozklad i v takovém statistickém souboru, který buď žádnou strukturu vůbec nemá, nebo obsahuje čistě náhodná data. Tato situace koresponduje s homogenní či difúzní preferencí na analyzovaném trhu. Velmi důležitá je otázka správné interpretace charakteru kritérií ve zpracovaných marketingových datech. Shlukovací metody na základě testů prováděných na empirických datech vykazují silnou citlivost na volbu typu kritérií. Jednotlivé typy kritérií použitých pro shlukování lze rozlišit na kvantitativní kritéria v intervalové a poměrové stupnici, ordinální, nominální a symetrická či asymetrická kritéria: kvantitativní obsahují číselné hodnoty v intervalové či poměrové stupnici. Kvantitativní data měřená v poměrové stupnici je před dalším zpracováním třeba nejprve pomocí logaritmické transformace převést do intervalové stupnice, ordinální číselné hodnoty lze sice uspořádat podobně jako u kvantitativních proměnných, nicméně tyto hodnoty nereprezentují žádný kvantitativní znak tak, aby bylo možno ohodnotit vzájemný rozdíl či poměr dvou hodnot. Při vhodně volené škále je samozřejmě možno mnoho kritérií ordinálního charakteru převést na kvantitativní proměnné (silný souhlas, souhlas, neutrální postoj, nesouhlas, silný nesouhlas). Zda má být konkrétní otázka marketingového dotazování spíše transformovaná na kvantitativní či ordinální proměnnou záleží zejména na konkrétní formulaci možných hodnot odpovědí na primární otázku v marketingovém dotazníku, nominální tyto proměnné diskrétně rozlišují jednotlivé odpovědi respondentů, nicméně neexistuje žádná přirozená interpretace uspořádání jednotlivých hodnot, například obor podnikání příslušné firmy. Takovýto typ otázek se velmi často vyskytuje v marketingových dotaznících, binární tyto proměnné nabývají pouze dvou hodnot, typicky ano/ne, souhlas/nesouhlas apod. Jsou speciálním případem nominálních proměnných, pokud je výskyt obou hodnot symetrický, nebo s uvážením možností asymetrického výskytu obou hodnot mohou být chápány jako speciální případ ordinálních proměnných. Jelikož mají tyto proměnné specifický charakter a z něj vyplývající metody zjišťování podobnosti, uvažujeme je jako samostatnou skupinu. Je třeba rozlišovat je na asymetrické, kdy má jedna z obou hodnot významnější výskyt než druhá, a symetrické, kdy je výskyt obou hodnot stejně významný. Správnou interpretaci charakteru zpracovávaných kritérií nelze zobecnit, jelikož vždy závisí na konkrétním analyzovaném trhu. Pokud se pro symetrické a asymetrické binární proměnné používají odlišné metody měření podobnosti, může takováto nesprávná interpretace opět podstatně zkreslit výsledné identifikované shluky a tedy celou strukturu analyzovaného trhu. Toto jsem empiricky ověřil na různých shlukovacích metodách. Změna interpretace kritérií jako nominálních či ordinálních nebo interpretace symetrie hodnot u binárních kritérií zásadně ovlivnila tvary výsledných shlukových rozkladů tak, že dokonce nebyla vyvrácena hypotéza nezávislosti takto identifikovaných shlukových rozkladů. Východiska a přístupy k využití exaktních metod v marketingu Stránka 6

7 2.3 Shluková analýza Pro shlukovou analýzu, která představuje jádro identifikace shluků v matematickém modelu, je k dispozici velká řada zdrojů, v nichž se informace redundantně opakují. Existují dva základní směry řešení tohoto problému, první představují klasické statistické metody, druhý modernější metody využívající neuronové sítě a další biologicky inspirované algoritmy. Jednotlivé metody jsou více či méně vhodné pro aplikace v různých oblastech. Specifické použití shlukové analýzy pro tržní segmentaci není v literatuře popsáno. Požadavky na vhodnou metodu jsou determinovány výše zmíněnými požadavky na tržní segment. Tyto požadavky jsou poměrně významné a kladou velká omezení na volbu vhodné metody. Vstupní data mají poměrně malý rozsah ve srovnání například s datovými soubory využitými pro hledání struktury informací v nestrukturovaných datech. Nezajímá nás rovněž kompletní shlukový rozklad a struktura datového souboru, ale nalezení takových shluků dat, které jsou vnitřně dostatečně homogenní, přitom dostatečně heterogenní navenek a zároveň mající dostatečnou velikost. Při hledání shluků nás tedy zajímá pouze omezený počet shluků, pokrývající dostatečnou část vstupního souboru, přitom nesmí být tyto shluky uměle sloučeny do jednoho pouze pro to, že by shluků bylo více než maximální počet. Naproti tomu velmi malý shluk, který je vnitřně velmi výrazně homogenní, může představovat model velmi atraktivního tržního mikrosegmentu, tedy tržního výklenku. Až na výjimky nejsou v literatuře u jednotlivých metod prezentovány empirické zkušenosti spojené s jejich chováním. V rámci diplomové práce a studijního bloku jsem se mimo jiné zaměřil na zkoumání empirického chování jednotlivých metod na vzorku dat malého marketingového dotazování. Aplikace shlukové analýzy ukazují v případě takovýchto dat vysokou citlivost na použitou metodu a případně použitou metriku či míru nepodobnosti. Pro testování jsem používal vlastní softwarový analytický nástroj původně navržený v rámci diplomové práce, analytické nástroje produktu Microsoft Excel a statistický analytický nástroj IBM SPSS. Ukazuje se, že většina popsaných metod shlukové analýzy má takové vlastnosti, které nezaručují takovou konzistenci výstupů, jaká je vyžadována omezeními stanovenými požadavky kladenými na tržní segmenty Perspektivní metody shlukové analýzy Optimalizační klasické metody, které jsou mimo jiné implementovány v nástroji IBM SPSS, neposkytly dle očekávání vyhovující výstupy. Jejich velmi silná závislost na poměrně jednoduché míře nepodobnosti ukazuje spolu s dosavadními empirickými výsledky na to, že nejde o vhodnou metodiku. Teoreticky velmi příznivé výsledky mohou přinášet hierarchické metody klasické shlukové analýzy, zde jsem se věnoval posouzení možné interpretaci jejich výsledů při jejich projekci na modelovaný trh, což je otázka spadající do třetí dílčí oblasti zmíněné problematiky. Mezi těmito metodami se jako nejvýhodnější zdají polytetické algoritmy, protože v každém shlukovacím kroku využívají míru nepodobnosti, která zohledňuje všechna kritéria. Podle mých dosavadních výsledků se však ukázalo, že polytetické algoritmy závisí velmi silně na kvantifikaci a normalizaci jednotlivých kritérií a nezachovávají sémantickou informaci o nepodobnosti. Identifikované segmenty se velmi obtížně interpretují. Naproti tomu monotetické algoritmy sémantickou informaci zachovávají velmi dobře. Pominu-li skutečnost, že se výsledky různých polytetických metod značně rozcházejí, je velmi Východiska a přístupy k využití exaktních metod v marketingu Stránka 7

8 obtížné definovat vhodnou míru nepodobnosti pro smíšená data, a tyto metody vykazují vysokou citlivost na míru nepodobnosti použitou k sestavení matice nepodobnosti. Proto je interpretace shlukových rozkladů vytvořených libovolnou polytetickou shlukovací metodou velmi problematická. Vzhledem k charakteru monotetického shlukování je interpretace nalezených shluků jako marketingových segmentů výrazně jednodušší. Základní optimalizační metoda k-průměrů silně závisí na pořadí objektů v datovém souboru, způsobu volby výchozích k centroidů, způsobu výpočtu polohy nového centroidu, jakož i na znalosti počtu hledaných shluků. Jde tedy o nedeterministickou metodu, která nalezne pouze lokálně optimální výsledek. Metoda k-průměrů pracuje s kvantitativními kritérii, nicméně byla navržena i její modifikace určená pro smíšená data, nazvaná metoda k-prototypů. V metodě k-prototypů je použita speciální míra nepodobnosti, která kombinuje kvadratickou Euklidovskou vzdálenost, použitou pro kvantitativní data, s mírou užívanou pro pouze kategoriální data v metodě k-modů, založené na koeficientu prostého nesouhlasu. Tento koeficient je definován jako poměr počtu proměnných, u nichž jsou u obou objektů rozdílné hodnoty, a celkového počtu proměnných Interpretace nalezených shluků Po zvolení optimálního shlukového rozkladu splňujícího požadavky dostatečné velikosti a dostatečné odlišitelnost, kladených na efektivní tržní segmenty je třeba vyhovět požadavku na přesnou definovanost. V případě analýzy dle behaviorálních aspektů je třeba použít druhé skupiny kritérií. U analýzy dle popisných kritérií je nejprve třeba rozhodnout, zda nalezené shluky na základě popisných kritérií vykazují obdobný soubor potřeb a preferencí, přičemž vlastní popis nalezených segmentů musí být proveden na základě popisných kritérií. Zde je tedy nezbytné před vlastním popisem posoudit, zda shluky reprezentují segmenty či sektory. Intuitivní přístup hledání popisu nalezených shluků spočívá v jejich projekci do datového souboru a hledání závislostí mezi objekty patřícími do téhož shluku a současně odlišností, které objekty z daného shluku dostatečně diferencují od objektů patřících do jiných shluků. Tento intuitivní postup v rámci návrhu exaktní metody pro tržní segmentaci formalizovat. Po nalezení jednoznačného popisu získaných segmentů byly splněny tři z pěti požadavků na efektivní tržní segmenty. Posouzení měřitelnosti a přístupnosti nalezených segmentů již záleží na marketérovi, který dokončí proces targetingu a v rámci positioningu může formulovat pro zvolené segmenty odpovídající strategii. 2.4 Faktorová analýza V rámci testování vzorových dat s produktem IBM SPSS byla posouzena i možnost aplikace faktorové analýzy při stanovování tržních segmentů. Hlavním cílem faktorové analýzy je hledání skrytých faktorů, které ovlivňují sledované proměnné datového souboru. Výsledkem je jednak zmenšení rozměru úlohy pro shlukovou analýzu v případě, kdy je použit velký počet kritérií, a dále pak nahrazení velkého počtu potenciálně skrytě korelovaných proměnných několika novými vzájemně buď vůbec nekorelovanými, případně málo korelovanými proměnnými faktory. V případě, že v datovém souboru jsou nalezeny vhodně interpretované nekorelované faktory, je Východiska a přístupy k využití exaktních metod v marketingu Stránka 8

9 možno tyto využít pro snazší popis nalezených shluků, tedy tržních segmentů. Velké množství behaviorálních preferenčních kritérií může být nahrazeno generickými kritérii, která danou množinu vzájemně korelovaných proměnných původního statistického souboru vzniklého na základě marketingového dotazníku lépe vystihují. Pro využití v marketingu při stanovení tržních segmentů může být faktorová analýza užitečná pro stanovení popisu nalezených shluků. Otázkou je, zda je vhodnější provést nejprve faktorovou analýzu datového souboru a zmenšit tak počet sledovaných proměnných a pracovat s transformovanými hodnotami nových proměnných, nebo provést shlukovou analýzu na původních skrytě korelovaných proměnných a získané shluky pak popsat pomocí hodnot faktorů jednotlivých objektů. Vzhledem k tomu, že pro optimální výsledky shlukové analýzy je nejvhodnější použít co nejmenší počet vzájemně nekorelovaných proměnných, ukazuje se jako jednoznačné východisko provést nejprve faktorovou analýzu původního souboru pocházejícího z marketingového dotazníku, tím zmenšit velikost úlohy na několik podstatných nekorelovaných proměnných, které bude následně možno použít pro popis nalezených shluků modelů tržních segmentů. Faktorová analýza vstupního souboru pocházejícího z marketingového dotazování představuje velmi slibný metodický nástroj na vytvoření konzistentních generických kritérií, které jednak zjednoduší a současně zpřesní shlukovou analýzu na těchto datech tak, že identifikované shluky budou konzistentní a zejména bude zjednodušena jejich následná interpretace. Pokud je provedena faktorová analýza skrytých faktorů, lze na základě identifikované závislosti jednotlivých proměnných na daných faktorech zkonstruovat projekcí přes faktorové rovnice popis shluků, který využije pouze ty proměnné deskriptivní kategorie, které významně závisí na daných faktorech. Tím se proces interpretace identifikovaných shluků značně zjednoduší. V případě, že je faktorová analýza provedena před vlastní shlukovou analýzou a je nalezena vhodná rotace shluků, která se blíží jednoduché struktuře faktorů, pracuje vlastní shluková analýza s již velmi homogenizovanými daty. Jestliže je navíc pro tyto společné faktory nalezena smysluplná a jednoznačná identifikace, jsou na základě výsledku shlukové analýzy získané shluky přímo jednoduše popsatelné. Mezi hlavní zmiňované nedostatky faktorové analýzy patří nejednoznačnost řešení, kdy interpretace faktorů záleží na normování hodnot proměnných a volbě korelační či kovarianční matice. Korelační matice se používá v případě proměnných, které mají různá měřítka. 2.5 Neuronové sítě a biologicky inspirované algoritmy Alternativou klasických metod shlukové analýzy jsou biologicky inspirované algoritmy, zejména metody založené na umělých neuronových sítích. Z velké nabídky dosud popsaných modelů umělých neuronových sítí je třeba se zaměřit na ty z metod, které jsou obecně vhodné pro explorační analýzu dat. Základní model umělé neuronové sítě vhodné pro využití ve shlukové analýze představují Kohonenovy samoorganizující mapy (self-organizing map), patřící mezi modely neuronové sítě s učením bez učitele. Svým chování připomínají klasickou optimalizační metodu k- průměrů (k-means) shlukové analýzy. Další metodiky biologických algoritmů zahrnují například neuronový plyn, konkurenční Hebbovské učení a genetické algoritmy. Aplikace umělých neuronových sítí představují velmi atraktivní oblast výzkumu Východiska a přístupy k využití exaktních metod v marketingu Stránka 9

10 v mnoha oborech včetně explorační analýzy dat. Pokud je explorační analýza dat použita v marketingové tržní segmentaci, musí být v úvahu bráno chování jednotlivých metod, charakter a podmínky kladené na hledané shluky, aby jejich následná interpretace skutečně vyjadřovala hledané vztahy a souvislosti mezi reálnými objekty. Kohonenova samoorganizující mapa je jednovrstvá umělá neuronová síť, která umožňuje vizualizovat topografii a hierarchickou strukturu multidimenzionálních dat transformací do prostoru nižší dimenze (tzv. komprese dat). Ve výkonné vrstvě existuje mřížka neuronů s danou topologií (obvykle hexagonální nebo čtvercovou), počet jejích vstupů odpovídá dimenzi vstupního počtu proměnných vstupního datového souboru, váhy vstupů neuronů vycházejí z předložených vstupních objektů a přenosová funkce představuje kvadratickou Euklidovskou vzdálenost. Postupným učením jsou nalezeny referenční vektory, tj. neurony, které fakticky představují reprezentanty nalezených shluků. Při použití pro tržní segmentaci existuje velmi striktní omezení na maximální počet hledaných shluků, nesmí jít o více než jednotky shluků. V případě, kdy se použije Kohonenova samoorganizující mapa s větším počtem neuronů než je počet očekávaných shluků, není možno transformovaná data dále agregovat do menšího počtu shluků. Získáme sice transformovaný dvojrozměrný obraz vícedimenzionálního vstupního souboru, ale ztrácíme veškeré informace o jeho struktuře. Z tohoto hlediska poskytuje tato umělá neuronová síť mnohem menší množství informací než využití klasických hierarchických shlukovacích metod. Je možno vizualizovat Euklidovskou vzdálenost mezi vzory referenčních vektorů mřížky mapy, nicméně není zřejmé, jak tyto shluky vypadají a jak se k sobě blíží. Pro jednotlivé objekty je sice k dispozici hodnota chyby vzhledem k referenčnímu vektoru, ale nelze zjistit, jaká je tato chyba vzhledem k referenčním vektorům sousedních shluků, resp. objektům sousedních shluků. Referenční vektory při trénování mapy větších rozměrů mají navíc tendenci rozmisťovat se po okraji mapy. Srovná-li se centroid získaný optimalizační klasickou metodou k-průměrů s referenčním vektorem Kohonenovy samoorganizující mapy, je zřejmé, že centroid podle zvolené metody výpočtu mnohem lépe vystihuje polohu shluku vzhledem k okolním shlukům. Sice by bylo možno redukovat velikost původního datového souboru pomocí Kohonenovy samoorganizující mapy větší dimenze a potom v dalším kroku dvoukrokové shlukové analýzy pracovat pouze se vzory referenčních vektorů, nicméně vzor referenčního vektoru jako reprezentanta shluku je méně přesný než centroid určený pomocí klasické optimalizační metody k-průměrů, resp. k-prototypů. Tato systematická chyba nejvíce ovlivnila rozdílnost shluků vytvořených pomocí metody k-průměrů a Kohonenovy samoorganizující mapy. Metoda k-prototypů je závislá na volbě hodnoty jedné empirické konstanty v průběhu iterací, podobně jako metoda k-průměrů není deterministická, neboť závisí na pořadí objektů ve vstupním datovém souboru, avšak její implementace v IBM SPSS v19 se chová z hlediska nalezení shlukového rozkladu velmi stabilně. Naproti tomu Kohonenova samoorganizující mapa závisí na volbě topologie mřížky, tvaru okolí, velikosti mřížky, požadovanému učícímu kroku, způsobu inicializace vstupních vektorů a počtu iterací. Ačkoliv bylo dosaženo shodných výsledků při opakovaných pokusech, u některých tvarů mřížky a počtů iterací docházelo k překroucení mřížky, které vyžadovalo opakované trénování mapy. Největší vliv na proces trénování mapy má Východiska a přístupy k využití exaktních metod v marketingu Stránka 10

11 úvodní inicializace vektorů mřížky, která vychází z náhodného nastavení a je zcela nedeterministická. Z tohoto hlediska se v případě Kohonenovy samoorganizující mapy nejedná o stabilní shlukovací metodu. Doba trénování Kohonenovy samoorganizující mapy implementované v balíku SOM_PAK 3.1 byla navíc více než řádově delší ve srovnání s výpočtem metody k- průměrů v produktu IBM SPSS v19, tedy i z tohoto hlediska se jeví méně vhodná zejména při dílčím zpracování větších datových souborů, pro které je výhodné využívat optimalizační shlukovací metody typu k-prototypů či k-průměrů. Ačkoliv tedy lze Kohonenovy samoorganizující mapy obecně využít pro shlukovou analýzu, jejich vlastnosti nejsou pro aplikaci v tržní segmentaci výhodné a nepřináší žádná pozitivní vylepšení oproti klasickým shlukovacím metodám. Lze tedy souhlasit se závěry, že v situaci, kdy existuje specifický algoritmus pro řešení konkrétního problému, tato umělá neuronová síť neposkytuje vhodnější výpočetní aparát. Při hledání velkého počtu shluků ve velkých vstupních datových souborech se potom Kohonenova samoorganizující mapa blíží chování metody k-průměrů. 2.6 Statistická analýza charakteristik vícerozměrných souborů Metody shlukové analýzy mohou poskytnout relevantní výsledky pouze na trhu, kde existují přirozené tržní segmenty a existuje jeho jistá struktura. Před vlastní shlukovou analýzou je tedy nezbytné vyloučit situaci, kdy mají zákazníci na trhu homogenní nebo difúzní preference, respektive platí analogická rozložení objektů při analýze dle popisných charakteristik. Detekce homogenní preference lze provést poměrně jednoduše, protože by ve statistickém souboru mělo být zjistitelné normální Gaussovo rozdělení, s tím, že může být střední hodnota posunuta v rámci rozsahu hodnot jednotlivých kritérií. Pro odhalení této preference v rámci jednotlivých kritérií lze použít standardní test dobré shody při neznámých parametrech teoretického statistického rozdělení. Pro efektivní testování normality rozdělení zkoumaného statistického souboru lze teoreticky provést pomocí některé míry nepodobnosti absolutně vztažené ke střední hodnotě vícerozměrného statistického souboru. Případně lze zjišťovat shodu s vícerozměrným Gaussovým rozdělením některou metodou vícerozměrné statistické analýzy. Velmi složitá je detekce difúzní preference, kdy jsou jednotliví zákazníci podle svých potřeb a přání náhodně rozmístěni po celém trhu. Pro detekci lze využít testy absence struktury, jejichž podstatou je testování metodou Monte Carlo pro následující testy: hypotéza náhodné polohy, vícemodální nulová hypotéza a model náhodné matice nepodobnosti. Jakmile byla vyloučena existence homogenní či difúzní preference na daném trhu, je možno aplikovat vhodnou hierarchickou shlukovací metodu. Vzhledem k následné interpretaci identifikovaných segmentů se v rámci empirických testů nejlépe osvědčila monotetická divizivní hierarchická shlukovací metoda MONA. Při alternativním použití polytetické míry nepodobnosti mezi objekty založené na Gowerově koeficientu, který se využívá u polytetické aglomerativní hierarchické shlukovací metody AGNES, je velmi obtížné interpretovat identifikované shluky jako marketingové segmenty. Použitím hierarchické shlukovací metody je získána hierarchická shluková struktura datového souboru, tu lze názorně graficky zobrazit pomocí dendrogramu, který je zakreslen jako binární strom, zaznamenávající úrovně slučování či rozkladu jednotlivých podshluků v průběhu iterací algoritmu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 11

12 Dalším problémem je rozhodnutí, v jaké hloubce hierarchického rozkladu má být proveden řez. Toto lze intuitivně na základě zkušenosti stanovit prohlížení dendrogramu, avšak je problematické tento postup formalizovat. Vzhledem k návaznému procesu targetingu je třeba zvážit požadavky dostatečné velikosti a měřitelnosti tržních segmentů tak, aby pro ně bylo možno stanovit vhodnou marketingovou strategii. Ukazuje se, že efektivní počet shluků v datovém souboru pocházejícím z marketingového dotazování by neměl být pravděpodobně větší než zhruba pět až deset shluků, neboť existence desítek segmentů dostatečné velikosti není na cílovém trhu příliš pravděpodobná. Existence jediného shluku byla již předem vyloučena při detekci homogenní preference. Pro posouzení kvality shlukového rozkladu z hlediska konzistence, tedy posouzení vnitřní homogenity a vnější heterogenity je nezbytné zjistit různé popisné charakteristiky daného vícerozměrného rozdělení, posoudit střední hodnoty, rozptyly apod., jejich relativní vztah mezi shluky, vzhledem k celému vstupnímu souboru, a rozhodnout zda shlukový rozklad vykazuje akceptovatelné hodnoty vzhledem k požadavkům kladeným na tržní segmenty. 2.7 Expertní systémy Expertní systémy představují poměrně dobře zpracovanou oblast umělé inteligence. Existuje několik základních přístupů pro realizaci diagnostických expertních systémů, první je založen na znalostní bázi, inferenčním mechanizmu a vysvětlovacím modulu zde existuje mnoho různě sofistikovaných algoritmů, které se souhrnně označují jako pravidlové diagnostické modely využívající povrchových znalostí. Další možnosti zahrnují neuronové, genetické či fuzzy expertní systémy. Neuronové expertní systémy jsou založeny na principu neuronové sítě s učením s učitelem. Pro exaktní metodiku marketingové tržní segmentace je třeba formalizovat intuitivní postup zkušeného marketéra v oblasti volby segmentačních kritérií, hledání optimální hloubky řezu dendrogramu, pokud budou v rámci shlukování využity metody hierarchické shlukovací analýzy, a posouzení kvality shlukového rozkladu. Pro tento účel je vhodné použít pravidlový expertní systém využívající heuristických povrchových znalostí, přičemž je nezbytné zohlednit váhu jednotlivých použitých informací například ve formě pseudobayesovského modelu. Rozhodovací pravidla expertního systému pak budou definována na základě heuristik založených na statistikách vycházejících z jednotlivých kritérií vstupního datového souboru, jejich typů, kategorií a vah. Je tedy nutné identifikovat vhodné heuristiky. 2.8 Strojové učení z kvalifikovaných příkladů V případě, kdy je k dispozici pravděpodobný optimální shlukový rozklad vyhovující požadavkům na tržní segmentaci, je nutné vzniklé shluky vhodně popsat pomocí souboru kritérií popisných charakteristik tak, aby nalezené segmenty splňovaly požadavek na jednoznačnou definovanost. Pro exaktní realizaci těchto úloh lze využít strojové učení z kvalifikovaných příkladů. K dispozici je seznam objektů popsaných souborem popisných kritérií a znalost jejich příslušností do jednotlivých shluků, tedy pro každý shluk jsou známy množiny pozitivních a negativních příkladů. Při těchto předpokladech lze například aplikovat algoritmus AQ, který na základě těchto vstupních dat dokáže specifikovat na Východiska a přístupy k využití exaktních metod v marketingu Stránka 12

13 výstupu produkční pravidla, která pro každý shluk definují podle jeho popisných kritérií maximální generalizaci, tj. nejobecnější popis, který zaručuje pro analyzované objekty příslušnost daného objektu a současně vylučuje začlenění objektu nesplňujícího tento popis do daného shluku. Produkční pravidla vygenerovaná algoritmem AQ tvoří nejobecnější popis daných shluků a jsou faktickým popisem efektivních tržních segmentů. Aplikací výše popsané exaktní metody je možno ze zadaných dat pocházejících z marketingového dotazovaní či jiných zdrojů identifikovat a následně popsat efektivně využitelné tržní segmenty. V algoritmu AQ se využívá pro volbu nejvhodnějšího popisu preferenční kritérium, které v rámci sestavování výsledného popisu vybírá ten nejlepší z množiny alternativních popisů. Volba popisných atributů přednostně používaných pro vytváření popisů by měla vycházet z vah jednotlivých kritérií zadaných uživatelem na vstupu ve druhém kroku algoritmu navrhované exaktní metody. Volba vhodné heuristiky pro stanovení preferenčního kritéria algoritmu AQ je otázkou dalšího výzkumu. 3. Návrh struktury exaktní metody tržní segmentace Na základě shromážděných informací jsem provedl strukturaci celé problematiky tržní segmentace a následného targetingu tak, aby celá metoda odpovídala struktuře procesu, který je možno algoritmicky realizovat. Návrh obecné metody je zaměřen na analýzu dle behaviorálních aspektů s tím, že v případě analýzy dle popisných charakteristik by bylo nezbytné před nalezením popisu posoudit, zda identifikované shluky vykazují vnitřní homogenitu vzhledem k souboru behaviorálních kritérií a tedy, zda se jedná o segmenty či sektory. Návrh schématu metody je zobrazen na obrázku 1. Východiska a přístupy k využití exaktních metod v marketingu Stránka 13

14 Obrázek 1. Východiska a přístupy k využití exaktních metod v marketingu Stránka 14

15 3.1 Kvantifikovaný datový soubor Algoritmus očekává následující vstupy, které musí zajistit uživatel. Nejprve je třeba zadat vlastní datový soubor s kvantifikovanými kritérii po provedení nezbytných transformací. Možnostem interpretací kritérií a jejich transformacím jsem se věnoval v rámci diplomové práce. V tomto kroku dojde k transformaci výsledků původního dotazníku do matematické formy a vzniká vlastní model. 3.2 Volba typů kritérií, jejich kategorií a vah Volba typů kritérií, jejich kategorie a vah má velký dopad na výsledný shlukový rozklad. V dalším kroku musí uživatel specifikovat jednotlivé typy kritérií a jejich rozdělení do kategorií s případným empirickým stanovením jejich vah. Je nezbytné stanovit správnou kategorii kritéria, tedy zda se jedná o behaviorální či popisné kritérium, a určit jeho typ. V rámci empirických testů jsem si ověřil, že shlukovací algoritmy mají vysokou citlivost na volbu typu kritéria. Volitelně je možno stanovit rovněž váhu daného kritéria tak, aby byl zohledněn jeho vliv na průběh procesu segmentace a targetingu. V tomto okamžiku jsou zadány všechny požadované informace. 3.3 Faktorová analýza Jak jsem uvedl, faktorová analýza představuje vhodný prostředek pro zjednodušení množiny kritérií, podle nichž se bude shlukovat. Jednak je zde možnost vyloučení vlivu duplicitních a závislých kritérií a dále lze vytvořit generická kritéria typu citlivost na cenu, citlivost na kvalitu, citlivost na design apod. Faktorová analýza by měla být provedena odděleně na množině behaviorálních a na množině popisných kritérií, aby nedošlo k jejich nežádoucí provázanosti. Interpretace generických faktorů je velmi problematická, teoreticky by měla být řešitelná rozšířením o pravidlový expertní systém, nicméně vytvoření příslušné znalostní báze pro takovýto expertní systém je velmi problematické. Podstatnou výhodou snížení počtu kritérií v obou kategoriích je snazší nalezení vhodného popisu identifikovaných segmentů. 3.4 Volba množiny shlukovacích kritérií V následujícím kroku je nezbytné zajistit výběr vhodných kritérií pro vlastní shlukování. Volba by měla být provedena především z kritérií behaviorálních kategorií s možností doplnění o zajímavá popisná kritéria. V současné době tato volba závisí zejména na intuici a osobních zkušenostech, z důvodu algoritmické formalizace lze tuto úlohu realizovat ve formě dedikovaného diagnostického expertního systému. Ve formě pravidel lze formalizovat různé kombinace charakteristik dané množiny kritérií, váhy, rozptyly, statistická rozdělení jednotlivých kritérií, korelace s jinými kritérii apod. V případě použití generických faktorů po předchozí faktorové analýze lze pracovat s menším počtem kritérií a pravidla bude možno jednodušeji formulovat. 3.5 Test difúzní preference Po rozhodnutí o výběru vhodné množiny kritérií použitých pro shlukování je nutno vyloučit existenci difúzní preference v datovém souboru. Jak bylo vysvětleno ve Východiska a přístupy k využití exaktních metod v marketingu Stránka 15

16 shrnutí informací z dostupných zdrojů, pro tyto testy lze využít simulaci pomocí metody Monte Carlo a testy hypotézy náhodné polohy, vícemodální nulové hypotézy a model náhodné matice nepodobnosti. Jedná se o aplikaci různých statistických hypotéz v datovém souboru. Pokud nejsou tyto hypotézy zamítnuty, je proces ukončen se závěrem, že v modelu se vyskytuje difúzní preference. Hledání shlukového rozkladu by v takovémto případě bylo zbytečné, protože by se jednalo o uměle vytvořené shluky, které by nevyhověly požadavkům na tržní segmenty. 3.6 Test homogenní preference Jestliže je zamítnuta možnost difúzní preference, je nezbytné posoudit, zda se v daném datovém souboru nevyskytuje homogenní preference. Možné způsoby otestování této hypotézy byly rovněž naznačeny v kapitole věnované informacím z dostupných zdrojů. Jedná se o aplikaci několika vhodných testů jednorozměrné a vícerozměrné statistické analýzy. Po vyloučení homogenní preference lze použít předpoklad existence shlukové struktury a je možno přistoupit k provedení vlastní shlukové analýzy. V opačném případě je proces ukončen se závěrem, že datový model má homogenní preferenci. Nalezený shlukový rozklad by byl rovněž v tomto případě umělý a nesplňoval by požadavky kladené na tržní segmenty. 3.7 Shluková analýza V případě datového souboru velkého rozsahu je možno aplikovat algoritmy dvoukrokového shlukování, kdy v prvním kroku je zkomprimován rozsah dat pomocí optimalizačního shlukovacího algoritmu metody k-prototypů. Zredukovaný datový soubor je pak následně zpracován pomocí monotetického divizivního hierarchického algoritmu MONA, případně jiného vhodného algoritmu, který bude vhodně uchovávat sémantickou konzistenci vzhledem k homogenitě identifikovaného shluku. Výhodou hierarchických algoritmů je ta skutečnost, že jsou deterministické a nevyžadují žádné odhady počtu shluků, což může u souborů menších rozsahů výrazně ovlivnit výsledný shlukový rozklad. Je rovněž nutné zachovat informaci o počtu identických vektorů ve vstupním souboru. Výsledkem shlukování je znalost kompletní hierarchické struktury datového souboru, kdy musíme rozhodnout, který shlukový rozklad je optimální vzhledem k požadavkům na tržní segmenty. 3.8 Rozhodnutí o hloubce řezu Pro stanovení shlukového rozkladu, který by odpovídal modelu efektivních tržních segmentů na daném cílovém trhu, je nezbytné stanovit hloubku, v níž dojde v rámci vytvořeného dendrogramu k řezu. Pro způsoby hledání optimální hloubky existují různá empirická pravidla a testy, jejichž přímé aplikování na empiricky získaná data se neosvědčilo. Jelikož zatím jedinou možností pro řešení této úlohy je aplikace intuice a zkušeností, je třeba pro exaktní řešení této úlohy analogicky využít pravidlový pseudobayesovský expertní systém, podobně jako v dílčí úloze rozhodnutí o vhodné množině kritérií použitých pro shlukování, tedy fakticky volby efektivních segmentačních kritérií. Jednotlivé heuristiky pravidel tohoto expertního systému mohou být definovány na základě rozsáhlejší analýzy různých empirických datových souborů. Primárně je nutné posoudit konzistenci shlukového rozkladu, zejména vnitřní Východiska a přístupy k využití exaktních metod v marketingu Stránka 16

17 homogenitu shluků, vnější heterogenitu mezi shluky a počty shluků v daném rozkladu a jejich velikosti a tvary. 3.9 Nalezení popisu shlukového rozkladu Po předchozím kroku má již algoritmus znalost pravděpodobného optimálního shlukového rozkladu reprezentujícího model efektivních tržních segmentů. Zbývá pouze úloha vzniklé shluky vhodně popsat pomocí souboru kritérií popisných charakteristik tak, aby nalezené segmenty splňovaly požadavek na jednoznačnou definovanost. Jak jsem uvedl v kapitole věnované informacím z dostupných zdrojů, představuje vhodnou metodiku pro řešení tohoto dílčího problému aplikace strojového učení z kvalifikovaných příkladů. Algoritmus AQ je schopen specifikovat produkční pravidla, která definují podle jeho popisných kritérií nejobecnější popis efektivních tržních segmentů podle popisných kritérií. Tento popis zajistí jednoznačné zařazení či nezařazení daného objektu do příslušného shluku. Pokud byla v rámci procesu provedena faktorová analýza, máme na konci zpracování algoritmu k dispozici specifikaci shluků podle behaviorálních i popisných generických kritérií. V případě, že generickým kritériím dodáme vhodnou interpretaci, máme k dispozici vytvořený model tržní segmentace na základě daného marketingového dotazování s tím, že jsme schopni tento model popsat obecnými behaviorálními nebo popisnými kritérii. 4. Osnova disertační práce Disertační práce bude uvedena teoretickou částí obsahující výchozí poznatky spolu s diskusí k jejich přínosu, detailně rozvine návrh struktury exaktní metody tržní segmentace, zhodnotí její praktické využití a shrne přínosy a závěry celé práce. Bude mít následující osnovu: 1. Úvod a záměr práce 2. Segmentace a targeting v marketingu a jejich význam 3. Problematika modelování dat marketingových dotazníků 4. Analýza konzistence kritérií 5. Shluková analýza a její využitelnost v marketingu 6. Faktorová analýza a její využitelnost v marketingu 7. Analýza konzistence shlukového rozkladu 8. Expertní systémy a jejich využitelnost v marketingu 9. Strojové učení z kvalifikovaných příkladů a jeho využitelnost v marketingu 10. Exaktní metoda tržní segmentace a její implementace 11. Praktické výsledky exaktní metody 12. Závěr a zhodnocení přínosů práce Analýza konzistence kritérií bude zahrnovat návrh vhodných heuristických pravidel pseudobayesovských expertních systémů pro volbu optimální množiny kritérií využitých pro aplikaci shlukové analýzy na datovém souboru. Analýza konzistence shlukového rozkladu bude analogicky zahrnovat návrh vhodných heuristických pravidel pro stanovení optimální hloubky řezu nalezeného shlukového rozkladu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 17

18 5. Shrnutí a závěr Cílem této odborné studie bylo shrnout dosavadní poznatky a výsledky ze studijní etapy doktorského studia, které jsou využitelné pro vypracování disertační práce s tématem Využití exaktních metod v marketingu. V rámci zpřesnění zadání bych se chtěl zaměřit na shrnutí teoretického aparátu, který je potřebný pro precizaci návrhu exaktní metody tržní segmentace. Deklarovaným účelem exaktní metody tržní segmentace je vytvoření algoritmického postupu, který by byl v rámci disertační práce implementován a prakticky vyzkoušen. Výstupem této metody by měl být model tržní segmentace popsaný pomocí popisných i behaviorálních kritérií, který by měl být deterministický, měl by poskytnout optimální, či lokálně optimální řešení takové, které bude odborně porovnatelné s intuitivně provedenou tržní segmentací. Na základě vymezených oblastí byla navržena kostra takovéto exaktní metody, umožňující z kvantifikovaných dat marketingového dotazování získat formální popis vymezující dané tržní segmenty pomocí popisných charakteristik. Navržená metoda formalizuje intuitivní postup, používaný při aplikaci shlukové analýzy na kvantifikovaných marketingových datech. Dlouhodobým cílem disertační práce je takové rozpracování exaktní metody pro stanovení tržních segmentů, které umožní její softwarovou implementaci na úrovni, která by umožnila praktické využití v rámci tvorby marketingových strategií výrobních a obchodních organizací. Disertační práce vypracovaná podle tohoto návrhu by tedy měla být přínosem pro následné praktické využití v marketingu. Východiska a přístupy k využití exaktních metod v marketingu Stránka 18

19 Použitá literatura DARREN, K., MALLERY, P. SPSS for Windows Step-by-Step: A Simple Guide and Reference, 10.0 Update (3rd Edition). Prentice Hall 2000 Electronic Statistics Textbook [online]. Tulsa: StatSoft Dostupný z WWW: EVERITT, B.S., LANDAU, S., LEESE, M. Cluster analysis, 4th edition. London: Arnold, a member of the Hodder Headline Group 2001 HEBÁK, P., HUSTOPECKÝ, J., PECÁKOVÁ, I., PRŮŠA, M., ŘEZANKOVÁ, H., SVOBODOVÁ, A., VLACH, P. Vícerozměrné statistické metody (3). Praha: Informatorium 2006 CHEN, N., MARQUES, N.C. An Extension of Self-Organizing Maps to Categorical Data [online]. Caparica: Universidade Nova de Lisboa. Dostupný z WWW: KOHONEN, T. Self-Organizing Maps. Berlin: Springer-Verlag 1995 KOHONEN, T., HYNNINEN, J., KANGAS, J., LAAKSONEN, J. SOM_PAK The Self- Organizing Map Program Package Version 3.1 [online]. Helsinki: Helsinki University of Technology Dostupný z WWW: KOTLER, P., KELLER, K. L. Marketing management, 12. vydání. Prague: Grada Publishing 2007 MAŘÍK, V., ŠTĚPÁNKOVÁ, O., LAŽANSKÝ, J. et al. Umělá inteligence (1), Prague: Academia 1993 MAŘÍK, V., ŠTĚPÁNKOVÁ, O., LAŽANSKÝ, J. et al. Umělá inteligence (2), Prague: Academia 1997 PALLANT, J. SPSS Survival Manual, 3rd Edition. Maidenhead: Open University Press 2007 ŘEZANKOVÁ, H., HÚSEK, D., SNÁŠEL, V. Shluková analýza dat. Prague: Professional Publishing 2007 ŠNOREK, M. Neuronové sítě a neuropočítače. Praha: Vydavatelství ČVUT 2004 TOMEK, G., VÁVROVÁ, V. Marketing od myšlenky k realizaci. Prague: Professional Publishing 2008 VÍT, D. Interpretation of monothetic and polythetic clustering method results for marketing questionaire processing : paper draft for Acta Polytechnica. Prague: CTU FEE Word Document. Unpublished. Východiska a přístupy k využití exaktních metod v marketingu Stránka 19

20 VÍT, D. Aplikace nástroje PASW SPSS 18.0 Base v tržní segmentaci: seminar thesis. Prague: CTU FEE Word Document. Unpublished. VÍT, D. Kohonenova samoorganizující mapa a její aplikace v marketingu. Prague: CTU FEE Word Document. Unpublished. VÍT, D. Exact Approach to Market Segments Determination. In POSTER Proceedings of the 14th International Conference on Electrical Engineering [CD-ROM]. Praha: ČVUT v Praze, FEL, 2010 VÍT, D. Využití shlukové analýzy v marketingu: master thesis, Prague: CTU Faculty of electrical engineering 2009 VÍT, D. Vliv marketingového dotazování na identifikaci tržních segmentů. Prague: Marketing & komunikace. 2009, roč. XIX, č. 4, s XU, R., WUNSCH, D.C. Clustering. Piscataway: IEEE Press 2007 ZHEXUE, H. Clustering large data sets with mixed numeric and categorical values. In Lu Hongjun, Motoda Hiroshi, Liu Huan (eds), Proceedings of the 1st Pacific-Asia Conference on Knowledge Discovery & Data Mining. Singapore, World Scientific (1997) Východiska a přístupy k využití exaktních metod v marketingu Stránka 20