Obecná metodologie dataminingová metoda dynamické segmentace aplikovaná v Business Intelligence

Podobné dokumenty
Metodika zpracování finanční analýzy a Finanční udržitelnost projektů

Schéma modelu důchodového systému

Porovnání způsobů hodnocení investičních projektů na bázi kritéria NPV

Demografické projekce počtu žáků mateřských a základních škol pro malé územní celky

Vliv funkce příslušnosti na průběh fuzzy regulace

Analýza rizikových faktorů při hodnocení investičních projektů dle kritéria NPV na bázi EVA

Věstník ČNB částka 25/2007 ze dne 16. listopadu 2007

Využijeme znalostí z předchozích kapitol, především z 9. kapitoly, která pojednávala o regresní analýze, a rozšíříme je.

ZPŮSOBY MODELOVÁNÍ ELASTOMEROVÝCH LOŽISEK

INDIKÁTORY HODNOCENÍ EFEKTIVNOSTI VÝDAJŮ MÍSTNÍCH ROZPOČTŮ DO OBLASTI NAKLÁDÁNÍ S ODPADY

5. Využití elektroanalogie při analýze a modelování dynamických vlastností mechanických soustav

Analýza citlivosti NPV projektu na bázi ukazatele EVA

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava 4. TROJFÁZOVÉ OBVODY

Maxwellovy a vlnová rovnice v obecném prostředí

Měření výkonnosti údržby prostřednictvím ukazatelů efektivnosti

Pasivní tvarovací obvody RC

Přednáška kurzu MPOV. Klasifikátory, strojové učení, automatické třídění 1

Skupinová obnova. Postup při skupinové obnově

FINANČNÍ MATEMATIKA- ÚVĚRY

APLIKACE INDEXU DAŇOVÉ PROGRESIVITY V PODMÍNKÁCH ČESKÉ REPUBLIKY

4. Střední radiační teplota; poměr osálání,

Úloha V.E... Vypař se!

Zásady hodnocení ekonomické efektivnosti energetických projektů

Vybrané metody statistické regulace procesu pro autokorelovaná data

Teorie obnovy. Obnova

IMPULSNÍ A PŘECHODOVÁ CHARAKTERISTIKA,

Metodika transformace ukazatelů Bilancí národního hospodářství do Systému národního účetnictví

Ekonomika podniku. Katedra ekonomiky, manažerství a humanitních věd Fakulta elektrotechnická ČVUT v Praze. Ing. Kučerková Blanka, 2011

transformace Idea afinního prostoru Definice afinního prostoru velké a stejně orientované.

Obr.1 Stridulující jedinec druhu Palpimanus gibbulus

Manuál k vyrovnávacímu nástroji pro tvorbu cen pro vodné a stočné

PLL. Filtr smyčky (analogový) Dělič kmitočtu 1:N

FAKULTA APLIKOVANÝCH VĚD

Seznámíte se s principem integrace substituční metodou a se základními typy integrálů, které lze touto metodou vypočítat.

Analýza časových řad. Informační a komunikační technologie ve zdravotnictví. Biomedical Data Processing G r o u p

Věstník ČNB částka 15/2003 ze dne 1. října 2003 KTERÝM SE STANOVÍ MINIMÁLNÍ VÝŠE LIKVIDNÍCH PROSTŘEDKŮ A PODMÍNKY TVORBY POVINNÝCH MINIMÁLNÍCH REZERV

Aplikace analýzy citlivosti při finačním rozhodování

Dotazníkové šetření- souhrnný výsledek za ORP

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE PROVOZNĚ EKONOMICKÁ FAKULTA DOKTORSKÁ DISERTAČNÍ PRÁCE

MODELOVÁNÍ SOUPROUDÉHO VÝMĚNÍKU TEPLA V SIMULINKU S VYUŽITÍM S-FUNKCÍ

APLIKACE VYBRANÝCH MATEMATICKO-STATISTICKÝCH METOD PŘI ROZHODOVACÍCH PROCESECH V PŮSOBNOSTI JOINT CBRN DEFENCE CENTRE OF EXCELLENCE

( ) Základní transformace časových řad. C t. C t t = Μ. Makroekonomická analýza Popisná analýza ekonomických časových řad (ii) 1

Využití programového systému MATLAB pro řízení laboratorního modelu

Jméno a příjmení holka nebo kluk * Třída Datum Škola

NÁPOVĚDA K SOFTWAROVÉMU PRODUKTU OPTIMALIZACE NÁKLADŮ

Specifikace minimálních požadavků železnice na ukazatele kvality signálu GNSS/GALILEO pro nebezpečnostní železniční telematické aplikace

Schöck Isokorb typ KST

5 GRAFIKON VLAKOVÉ DOPRAVY

Studie proveditelnosti (Osnova)

Zhodnocení historie predikcí MF ČR

73-01 KONEČNÝ NÁVRH METODIKY VÝPOČTU KAPACITU VJEZDU DO OKRUŽNÍ KOMENTÁŘ 1. OBECNĚ 2. ZOHLEDNĚNÍ SKLADBY DOPRAVNÍHO PROUDU KŘIŽOVATKY

Reaktor s exotermní reakcí. Reaktor s exotermní reakcí. Proč řídit provoz zařízení. Bezpečnost chemických výrob N111001

Věstník ČNB částka 16/2004 ze dne 25. srpna 2004

Popis regulátoru pro řízení směšovacích ventilů a TUV

2.2.8 Jiné pohyby, jiné rychlosti I

MENDELOVA ZEMĚDĚLSKÁ A LESNICKÁ UNIVERZITA V BRNĚ

Formalizace řešení přidělení náhradní nástupištní koleje pro zpožděný vlak

Srovnání výnosnosti základních obchodních strategií technické analýzy při obchodování měn CZK/USD a CZK/EUR 1

Nové indikátory hodnocení bank

FREQUENCY SPECTRUM ESTIMATION BY AUTOREGRESSIVE MODELING

Zobrazování černobílých snímků v nepravých barvách

MĚNOVÁ POLITIKA, OČEKÁVÁNÍ NA FINANČNÍCH TRZÍCH, VÝNOSOVÁ KŘIVKA

2.2.2 Měrná tepelná kapacita

SBĚRNICOVÝ ŘÍDICÍ SYSTÉM SOMFY IB. Technická specifikace

LS Příklad 1.1 (Vrh tělesem svisle dolů). Těleso o hmotnosti m vrhneme svisle

Modelování hydrogramů průtokových vln v říčním systému s využitím neuronových sítí

2. ZÁKLADY TEORIE SPOLEHLIVOSTI

Ing. Petra Cihlářová. Odborný garant: Doc. Ing. Miroslav Píška, CSc. Technologie výroby II Obsah kapitoly

Příjmově typizovaný jedinec (PTJ)

Lineární rovnice prvního řádu. Máme řešit nehomogenní lineární diferenciální rovnici prvního řádu. Funkce h(t) = 2

Číslicový lineární filtr prvého řádu se statisticky optimálně nastavovanými parametry

213/2001 ve znění 425/2004 VYHLÁŠKA. Ministerstva průmyslu a obchodu. ze dne 14. června 2001,

ÚVOD DO DYNAMIKY HMOTNÉHO BODU

Dotazníkové šetření 1 - souhrnný výsledek za ORP

Návod k obsluze. Vnitřní jednotka pro systém tepelných čerpadel vzduch-voda s příslušenstvím EKHBRD011ABV1 EKHBRD014ABV1 EKHBRD016ABV1

Hydrostatické váhy. HANA MALINOVÁ Katedra didaktiky fyziky, MFF UK. Princip hydrostatického vážení. Veletrh nápadů učitelů fyziky 14

Modelování rizika úmrtnosti

Úloha II.E... je mi to šumák

Řasový test toxicity

pro napojení ocelových nosníků velkého průřezu na ocelovou konstrukci (s více než dvěma moduly)

3. Charakteristika školního vzdělávacího programu

CZ Štěpán Vimr, student učitelství Zpráva z pracovní návštěvy Sucy-en-Brie, Francie

UNIVERZITA PARDUBICE Fakulta elektrotechniky a informatiky STAVOVÁ REGULACE SOUSTAVY MOTOR GENERÁTOR. Bc. David Mucha

Working Papers Pracovní texty

Univerzita Pardubice. Fakulta ekonomicko správní

EKONOMICKÁ FAKULTA KATEDRA FINANCÍ

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika přednášky LS 2006/07

Matematické základy teorie a aplikací nelineárních dynamických systémů

Analogový komparátor

Úrokové daňové štíty nemusí být jisté

STATICKÉ A DYNAMICKÉ VLASTNOSTI ZAŘÍZENÍ

Částka 7 Ročník Vydáno dne 4. září 2013 ČÁST NORMATIVNÍ ČÁST OZNAMOVACÍ

Scenario analysis application in investment post audit

POPIS OBVODŮ U2402B, U2405B

Seznam parametrů Vydání 04/03. sinamics SINAMICS G110

Základní škola Ústí nad Labem, Rabasova 3282/3, příspěvková organizace, Ústí nad Labem. Příloha č.1. K SMĚRNICI č. 1/ ŠKOLNÍ ŘÁD

EKONOMETRIE 6. přednáška Modely národního důchodu

PŘÍLOHA SDĚLENÍ KOMISE. nahrazující sdělení Komise

Stýskala, L e k c e z e l e k t r o t e c h n i k y. Vítězslav Stýskala TÉMA 6. Oddíl 1-2. Sylabus k tématu

Syntéza řeči 4. Jindřich Matoušek

Transkript:

9 ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Provozně ekonomiká fakula Kaedra saisiky Obená meodologie daaminingová meoda dynamiké segmenae aplikovaná v Business Inelligene Diserační práe Ing. Tereza Bělková Saniago de Cile červen, 005

SOUHRN Obená meodologie daaminingová meoda dynamiké segmenae aplikovaná v Business Inelligene Jeden ze široe užívaný násrojů v oblasi idenifikae vzorů ování, Daa Miningu a aplikované saisiky, voří algorimy slukování, keré dovolují idenifikova sluky skryé v dae. Sluky, získané aplikaí exisujíí algorimů slukování, jsou saiké, edy přísluší foografii odno aribuů objeků získaný v jednom okamžiku. Avšak v případe, jako je například ování klienů v bane, se informae o objeke akualizuje v čase (ao skuečnos má dynamiký araker). Je proo nuné dle ování klienů v průběu času akualizova vzory ování sluků a edy disponova dynamikou meodou segmenae. Tao akualizae by měla využí znalosí získaný z předozí realizae slukování, kerá je obeně náročná na čas a vyžaduje úze speializovanou prái. Cílem éo práe je zkonsruova obenou meodologii, použielnou pro analýzu slukování, založenou na dynamikém ování objeků, kerá deekuje změny ve sluí a akualizuje vzory ování sluků opimálním způsobem. Její realizae bude vyáze ze srukury sluků vyvořené v předázejíí období. Pro splnění íle je idenifikován araker da vlasní-li nebo nevlasní idenifikáor a jsou definovány možné sénáře změny, kerými jsou: Zaování poču sluků, Tvorba nový sluků a Zrušení sluků. Výzkum se zaměřuje na vývoj obené meodologie pro případ da s idenifikáorem, kerá pojímá všeny možné sénáře změny. Navržená obená meodologie se skládá z pěi základní eap proesu: Eapa I: Idenifikae objeků, keré předsavují změnu, Eapa II: Rozpoznání savu změny, Eapa III: Rozodnuí o možnose akualizae sluků, Eapa IV: Zánik sluků a Eapa V: Idenifikae rajekorií. Každá eapa má svoji vlasní dynamiku. Snaou je definova každou eapu o možná nejobenějším způsobem. Obená meodologie, realizovaná pomoí meody k-means, byla aplikována na daa simulovaná i skuečná, kerá byla získána z Banky úvěru a invesi (Bano de Crédio

3 y Inversiones se zkrakou Bi) v Saniagu, Cile. Mimo splnění očekávaný ílů bylo proloubeno a povrzeno poznání o její další arakerisiká, keré jsou s výodou využívány při její aplikai v praxi. V oblasi Business Inelligene obená meodologie umožňuje flexibilizova a auomaizova proes dynamikéo daaminingovéo modelování maximalizují příležiosi obodu, keré na segmenovaném ru dosud nebyly plně využiy v důsledku dvou skuečnosí: neexisovala dynamiká enika slukování sopná vyjádři reálné proesy na ru a z oo odvozená druá příčina, kerou je zpožďování rozodování. Daný problém má dlouou rajekorii budouío výzkumu; ýká se například rozšíření řešení v jednolivý eapá obené meodologie idenifikovaný v éo prái či uplanění rozdílný meod a kriérií v ěo eapá.

4 Poděkování Obsa a formu zpraování předkládané diserační práe do značné míry ovlivnila skuečnos, že jsem měla možnos esova a sbíra posřey a zkušenosi nejen živoní, ale i sudijní a praovní, mimo území naší České republiky. Poděkování, že sojím zde - na koni začáku své profesní kariéry - paří elé mé rodině: Mamine, kerá mi sále připomínala, že mám ješě něo důležiéo dokonči. Dědovi, kerý mi svými živoními zkušenosmi byl oporou po dobu eléo univerzinío sudia. Babiče, kerá mi svými živoními zkušenosmi byla oporou duševní. Mému manželovi, Alejandrovi, o keréo se má rodina běem zpraovávání éo diserační práe rozrosla, paří mé poděkování nejvěší - za jeo respekování nedosaku společně rávenéo času až po saros o domános. V neposlední řadě by ráda poděkovala všem, se kerými jsem se po dobu svéo univerzinío sudia na ČZU v Praze sekala a keří mi svým osobním příkladem, radami a pomoí byli ou nejvěší moivaí. Zvlášní poděkování by ěla vyslovi svému školieli - do.ing.oakarovi Maáčkovi, CS., za jeo rpělivos a poskyovanou odbornou pomo. Děkuji. Ing. Tereza Bělková.

5 OBSAH ÚVOD... 0. OBLAST VÝZKUMU... 0. ZÍSKÁVÁNÍ ZNALOSTÍ Z BÁZE DAT A DATA MINING... 0.3 SITUACE VE VÝZKUMU....3. Současný vývoj v oblasi dynamikéo Daa Miningu....3. Logiký vývoj saikéo algorimu segmenae k dynamikému... 3.4 SHLUKOVÁNÍ OBJEKTŮ: KONCEPT A PŘÍKLADY... 6.5 DYNAMICKÉ CHOVÁNÍ SHLUKŮ A OBJEKTŮ... 8.6 DEFINICE DYNAMICKÉHO SHLUKOVÁNÍ... 0 CÍLE.... OBECNÝ CÍL.... SPECIFICKÉ CÍLE... 3 METODOLOGIE PRÁCE... 3 3. VYMEZENÍ PRÁCE... 3 4 PLÁN PRÁCE... 5 4. PERMANENTNÍ REVIZE LITERATURY... 5 4. PLÁN POKROKU PRÁCE NA DISERTAČNÍ PRÁCI... 5 5 DEFINICE OBECNÉ METODOLOGIE DYNAMICKÉ SEGMENTACE PRO PŘÍPAD OBJEKTŮ S IDENTIFIKÁTOREM... 7 5. SCÉNÁŘE ZMĚN VE VZORECH CHOVÁNÍ SHLUKŮ... 7 5. ETAPY IDENTIFIKACE SCÉNÁŘŮ ZMĚN... 8 6 VÝVOJ OBECNÉ METODOLOGIE DYNAMICKÉ SEGMENTACE PRO PŘÍPAD OBJEKTŮ S IDENTIFIKÁTOREM A SHLUKOVÁNÍ REALIZOVANÉ PROSTŘEDNICTVÍM ALGORITMU K- MEANS... 34 6. ETAPA I: IDENTIFIKACE OBJEKTŮ, KTERÉ PŘEDSTAVUJÍ ZMĚNU... 34 6.. Definie idenifikae objeků předsavujíí změnu... 36 6. ETAPA II: ROZPOZNÁNÍ STAVU ZMĚNY... 38 6.. Definie rozpoznání savu změny... 39 6.3 ETAPA III: ROZHODNUTÍ O MOŽNOSTECH AKTUALIZACE SHLUKŮ... 40 6.3. Definie akualizae klasifikaí do říd... 40 6.3. Definie akualizae poybem říd... 46 6.3.3 Definie akualizae vorbou nový sluků... 48 6.4 ETAPA IV: ZÁNIK SHLUKŮ... 53 6.5 ETAPA V: IDENTIFIKACE TRAJEKTORIÍ... 55 7 APLIKACE OBECNÉ METODOLOGIE PRO PŘÍPAD S IDENTIFIKÁTOREM ALGORITMEM K- MEANS... 57 7. APLIKACE NA DATA SIMULOVANÁ... 57 7.. Cyklus první... 59 7.. Cyklus druý... 80 7. APLIKACE NA DATA SKUTEČNÁ... 9 7.. Analyzovaný problém... 9 7.. Daa... 95 7..3 Aplikae obené meodologie... 96

6 8 VÝSLEDKY... 04 8. KONSTRUKCE KRITÉRIÍ NA SROVNÁVÁNÍ ALGORITMŮ... 04 8.. Teniké kriérium... 05 8.. Ekonomiké kriérium... 07 8. VYHODNOCENÍ KRITÉRIÍ SROVNÁVÁNÍ ALGORITMŮ... 08 8.. Vyodnoení enikéo kriéria... 08 8.. Vyodnoení ekonomikéo kriéria... 09 9 ZÁVĚR... 3 9. POHLED NA OBECNÉ CHARAKTERISTIKY OBECNÉ METODOLOGIE... 3 9. TECHNICKÝ A EKONOMICKÝ POHLED NA OBECNOU METODOLOGII... 5 9.3 MARKETINGOVÝ POHLED NA OBECNOU METODOLOGII... 6 9.4 HODNOCENÍ VÝKONNOSTI OBECNÉ METODOLOGIE JAKO METODY DYNAMICKÉ SEGMENTACE DATA MININGU... 7 9.5 BUDOUCÍ VÝZKUM, ALTERNATIVNÍ NÁVRHY ŘEŠENÍ... 7 9.6 DOPORUČENÍ... 9 0 LITERATURA... 0 PŘÍLOHY... 3. METODY VÝPOČTU VZDÁLENOSTI (PODOBNOSTI) A PŘÍPADY JEJICH POUŽITÍ... 3. SOUHRN SYMBOLŮ, DEFINIC A PARAMETRŮ... 4.3 ETAPY SE SVÝMI PODMÍNKAMI, KRITÉRII A PARAMETRY... 7.4 DATA SIMULOVANÉHO PŘÍPADU... 30.5 DEFINICE NEURONOVÉ SÍTĚ PRO PŘEDPOVĚĎ INDEXU ODCHODU... 33.6 DATA REÁLNÉHO PŘÍPADU... 34.7 STŘEDY SHLUKŮ V C AŽ C 4 VYTVOŘENÉ TŘEMI TECHNIKAMI SEGMENTACE... 35

7 Tiuly abulek Tab 7- Sředy sluků v... 59 Tab 7- Poče objeků ve sluí v... 59 Tab 7-3 Vzdálenosi sředů sluků navzájem v... 60 Tab 7-4 Tab 7-5 Tab 7-6 Vzdálenos objeků v ke sředu příslušnéo sluku v Poče a přemísění objeků mezi sluky mezi Vzdálenos objeků v a... 6... 63 3 3 ke sředu příslušnéo sluku v... 64 Tab 7-7 Sav rozodování v první eapě C... 66 Tab 7-8 Sav rozodování ve drué eapě C... 67 Tab 7-9 Sabilia poybu objeků ve sluí v C... 69 Tab 7-0 Sabilia poybu a směru objeků v proměnný X a X v C... 69 Tab 7- Sabilia poybu a směru vše objeků a zvlášť oulierů v proměnný X a X v C ve sluí a 3... 7 Tab 7- Sav rozodování ve řeí eapě C... 73 Tab 7-3 Poče objeků ve sluí před a po akualizai v 3 a kon... 75 Tab 7-4 Poče a umísění opravený objeků ve sluí po jeji akualizai v kon... 75 Tab 7-5 Konečný poče objeků ve sluí po opravá jeji zařazení v kon... 75 Tab 7-6 Sředy sluků v kon ( po )... 79 Tab 7-7 Tab 7-8 Tab 7-9 Tab 7-0 Tab 7- Poče objeků ve sluí v Vzdálenosi sředů sluků navzájem v Vzdálenos objeků v kon ( po )... 79 kon ( po )... 79 3 ke sředu příslušnéo sluku v Poče a přemísění objeků mezi sluky mezi Vzdálenos objeků v kon ( po )... 79 po a 3... 8 3 ke sředu příslušnéo sluku v po... 8 Tab 7- Sav rozodování v první eapě C... 83 Tab 7-3 Sav rozodování ve drué eapě C... 84 Tab 7-4 Sabilia poybu objeků ve sluí v C... 85 Tab 7-5 Sabilia poybu a směru objeků v proměnný X a X v C... 85 Tab 7-6 Sav rozodování ve řeí eapě C... 86 Tab 7-7 Poče objeků ve sluí před a po akualizai v 3 a kon... 86 Tab 7-8 Paměť regisru mezi ykly C až C 4 pro sluky 3 a 4... 87 Tab 7-9 Sředy sluků v kon ( 3 po )... 89 Tab 7-30 Tab 7-3 Tab 7-3 Poče objeků ve sluí v Vzdálenosi sředů sluků navzájem v Vzdálenosi objeků v kon ( 3 po )... 89 kon ( 3 po )... 89 3 ke sředu příslušnéo sluku v kon ( 3 po )... 89

8 Tab 7-33 Carakerisiky sluků v průběu aplikae obené meodologie v C a C... 90 Tab 7-34 Převod skuečný odno poeniální renabiliy do inervalu (0,)... 96 Tab 7-35 Carakerisiky sluků v průběu aplikae obené meodologie v C až C 4... 00 Tab 7-36 Markeingové sraegie v... 03 4 kon Tab 8- Původní a vysupňované odnoy aribuů sraegií... 08 Tab 8- Výsledky srovnání sraegií enikým kriériem pro rozdílné váy... 08 Tab 8-3 Kvalia slukování v C4 vyjádřená obenou meodologií, k-means vyrovnanou a segmenaí ve dvou fází vyrovnanou... Tab 8-4 Zodnoení plánu pos segmenační akivi obené meodologie jako ekonomiké kriérium Tiuly grafů Graf 7- Graf 7- Graf 7-3 Disribue objeků v mezi sluky v... 60 3 Rozložení objeků v uvniř sluků v... 6 Disribue objeků v mezi sluky v... 6 Graf 7-4 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v... 65 Graf 7-5 Objeky v 3 klasifikované do sluků v... 66 Graf 7-6 Disribue oulierů mezi zbývajíími objeky v 3... 67 Graf 7-7 Trajekorie sluku v průběu C... 70 Graf 7-8 Poyb objeků sabilní v poybu a jeji rajekorie ve sluku 4 v průběu C... 7 Graf 7-9 Poyb a rajekorie objeků sluku v průběu C... 7 Graf 7-0 Poyb a rajekorie objeků sluku 3 v průběu C... 73 Graf 7- Akualizae vzorů ování v C... 74 Graf 7- Oprava po akualizai a finální zařazení objeků do akualizovaný sluků v kon... 76 Graf 7-3 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v kon... 77 Graf 7-4 Graf 7-5 Graf 7-6 Graf 7-7 Graf 7-8 Graf 7-9 Graf 7-0 Reálné rajekorie poybu sluků mezi Disribue mezi sluky v po a kon... 78 po objeků... 8 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v kon... 83 Ouliery v 3 mezi klasifikovanými objeky do sluků v po... 84 Reálné rajekorie poybu sluků mezi po Přeled reálný rajekorií poybu sluků mezi Sluky v a kon... 88 po a kon... 9 po... 99 Graf 7- Trajekorie endene ování sluků v C až C 4... 0 Graf 8- Graf 8- Tendene ování sluků vyjádřené obenou meodologií, k-means vyrovnanou a segmenae ve dvou fází vyrovnanou a skuečné sředy sluků v budouí období... 0 Tendene ování vyjádřené obenou meodologií a segmenaí ve dvou fází na simulovaný dae...

9 Tiuly obrázků Obr - První sraegie logikéo vývoje saikéo algorimu k dynamikému... 4 Obr - Druá sraegie logikéo vývoje saikéo algorimu k dynamikému... 4 Obr -3 Třeí sraegie logikéo vývoje saikéo algorimu k dynamikému... 5 Obr -4 Čvrá sraegie logikéo vývoje saikéo algorimu k dynamikému... 6 Obr -5 Příklad idenifikovaný rajekorií vývoje srukury sluků v čase... 9 Obr -6 Příklad skuečný rajekorií vývoje ování objeků a srukury sluků v čase... 0 Obr 5- Akualizae vzorů ování sénáři změn... 8 Obr 5- Séma dynamiky eapy proesu... 9 Obr 5-3 Eapy proesu obené meodologie s indikaí rozodování dle kriérií pro někerý z ypů akualizae vzorů ování... 3 Obr 6- Objeky sluku... 37 Obr 6- Enropie ování objeků... 43 Obr 7- Cíle a někeré plány Bi na rok 005... 9 Obr 7- Séma meodologie práe BIO S... 93 Obr 7-3 Sloučení klienů do říd dle odno poeniální renabiliy a indexu ododu... 94

0 ÚVOD. Oblas výzkumu Jedna z nejčasěji řešený úlo v oblasi idenifikae vzorů (formáů) ování [][4], aplikované saisiky [9] a Daa Miningu [], spočívá v aplikai algorimu slukování (segmenae, angliky lusering) k rozdělení daovéo souboru do sluků (říd, segmenů) a získání jeji příslušný arakerisik. Vzorem ování je obeně nazývaná jakási absrakní reprezenae souboru da [6]. Meody slukování jsou ve své věšině limiovány ím fakem, že analyzují objeky v jednom deerminovaném okamžiku v čase. Algorimy (*) (publikované sofware) po vykonaném seskupení objeků již nejsou sopny agregova nový nebo efekivně akualizova již zařazený objek a vyvoři ak novou srukuru sluků (**), kerá vyází ze srukury již poznané. Z právě popsanéo je možné vyvodi poznání, že exisujíí algorimy segmenae mají saiký araker. V éo prái je věnována pozornos algorimu, kerý by definoval sluky v závislosi na dynamikém ování objeků. Předpokládá se oiž, že koninuálním sledováním ování objeků je možné deekova reálné změny ve formáe ování a na omo základě adekváním způsobem, vlasním každému segmenu, obnovi srukury sluků. Důležios vyvoření dynamikéo algorimu segmenae přiází mimo jiné aké s pořebou vyřeši siuae vzniklé akualizaí či agregaí objeků, keré moou zároveň znovu využí známou informai o srukuře sluků v minulosi. Teno poeniál je důležiý, jelikož aplikae v Daa Miningu bývají náročné na čas a speializai modeláora a při prakikém užií vyžadují zaování koninuiy pos modelační proesů.. Získávání znalosí z báze da a Daa Mining V současnosi, díky vývoji sofware a ardware, je možné skladova informae o objeke a isorii jeji ování ve velký bází da. To má nuně za následek vznik * ** V éo prái: algorimus neboli meoda. Vyvoři novou srukuru sluků neboli akualizova vzory ování znamená změni arakerisiky sluků, definované v předešlém časovém období, na základě použié meodologie.

oddělení výzkumu a aplikaí, ve kerý se rozvíjejí sraegie založené na informaí vyěžený z bází da [33]. Znalosi se z bází da získávají proesem KDD (Knowledge DaaBase Disovery). KDD je definován jako nebanální proes idenifikae vzorů v dae, keré jsou plané, nové, poeniálně užiečné a srozumielné [7]. Výše popsané je definováno jako proes a o na ozřejmění, že nalezení znalosí časo zarnuje experimeny a jeji opakované provádění, jednání s klieny, návry řešení a zpraování vedouí k uspokojení o dosaženém poznání z da jak ze srany uživaelů ak i klienů [7]. Zde naázejí úloy a algorimy Daa Miningu své užií [6][7][33]. Termín Daa Mining se vzauje k aku dolování vzorů ování z da [7]. Typiká reprezenae proesu KDD zarnuje devě základní kroků [33]: ) Pozorumění problému a ovládání aplikae sofware. ) Získání da, se kerými se bude praova. 3) Úprava da. 4) Reduke a ransformae da. 5) Výběr eniky Daa Miningu. 6) Výběr algorimu Daa Miningu. 7) Daa Mining. 8) Analýza výsledků Daa Miningu. 9) Uvrzení se v nalezeném poznání. Ve druém kroku je řeba vybra soubor dosupný da, kerá jsou jednoně uložena v bázi da neboli Daa Wareouse (sklad da) [33]. V mnoa reálný aplikaí obsaují daa v Daa Wareouse různé druy yb, například ybějíí údaje, odnoy přesaujíí logiký rozsa aribuu nebo odnoy, keré jsou nepravděpodobné. Teno důvod vede analyika ke řeímu kroku, kdy doází k předzpraování da [33]. V páé fázi je vybrána speifiká enika Daa Miningu pro deailní analýzu. Zde je řeba rozodnou, zda je ílem seskupova objeky (ož je úloa navrovaná v éo prái) nebo řeši další úkol v rámi modelování závislosí a nezávislosí mezi aribuy a objeky. Na základě ooo rozodnuí mají bý vybrány nejvodnější algorimy Daa Miningu (krok 6), aby poé moly bý užiy při ledání vzorů ování v dae (krok 7).

.3 Siuae ve výzkumu Dynamiký Daa Mining má ve výzkumný kruzí vzrůsajíí arakiviu. Uživaelé insalovaný násrojů Daa Miningu se nyní zajímají o využií enik souvisejíí s jeji praí. Jakmile věšina daaminingový sysémů (sysém ve smyslu modelae problému jisou enikou v rámi daaminingovéo násroje) bude pořebova akualizai v budounu (*), jeji zájem bude sousředěn právě na eniky dynamiké. Jesliže je budouí ování sysému velmi podobné omu minulému (například výnosy plodin na jisém půdním ypu nebo v jisé klimaiké zóně), užií počáečnío sysému Daa Miningu by se zdůvodňovalo. Mění-li se ovšem ování objeků v čase (například ování klienů ve finančním prosředí), sálé užívání počáečnío sysému by molo vés k nereálným výsledkům a z oo vyplývajíím neakepovaelným rozodnuím. Právě zde příází na řadu oblas novéo výzkumu, dynamikéo Daa Miningu (**)..3. Současný vývoj v oblasi dynamikéo Daa Miningu V oblasi Daa Miningu byly vyvíjeny nejrůznější eniky s ílem naléz užiečné informae v souboru da. Za nejdůležiější (z lediska frekvene používání) jsou považovány rozodovaí sromy, neuronové síě, asoiační zákony a meody slukování [0]. Pro každou výše zmíněnou daaminingovou eniku má akualizae různé orienae; někeré z navržený přísupů jsou zde zmíněny: Rozodovaí sromy: různorodé eniky na zvyšování supně učení, resrukuralizae sromů [3][9][30] a idenifikae konepu drif [4]. Neuronové síě: akualizae je časo užívána ve smyslu opakovanéo učení nebo zlepšení výkonnosi síě učením se z nový příkladů předkládaný síťovému modelu [3]. Asoiační pravidla: rozvinuí sysému pro dynamiký Daa Mining realizovaný enikou asoiační pravidel [5]. * ** Znalosi ování da vyěžené pomoí daaminingovéo sysému jsou založeny na analýze ování objeků v minulosi. Tradiční Daa Mining s dynamikými prvky.

3 Segmenae: v následujíím odsavi jsou srnuy přísupy k dynamikému Daa Miningu užívajíímu eniky segmenae, keré je možné naléz v lierauře. Současný dynamiký daaminingový sysém segmenae je sousředěn na vývoj slukovaío algorimu ve smyslu modelovaní změn pozi objeků v segmene pozorovaný v jisý momene v čase [5][34] (algorimy v Laen Gold nebo v segmenai ve dvou fází). Exisují aké výzkumy, zabývajíí se evolučním algorimem na opimalizai poču sluků v průběu času dynamiké dělení segmenu užiím vývojový sraegií [][5][][4]. Byl vyvinu sysém na vyjadření dynamikéo poybu sluků pro objeky bez idenifikae [5]..3. Logiký vývoj saikéo algorimu segmenae k dynamikému Až doposud se v úloá slukování používají v podsaě yo čyři sraegie:. Uživael nedbá na změny v prosředí a aplikuje výozí daaminingový sysém beze změn.. Je užíván počáeční sysém a novými day se provádí akualizae klasifikaí [][9]. 3. Pro každý yklus kerý závisí na konkréní aplikai a problému je vyvinu nový sysém užiím vše dosupný znalosí, da a enik. 4. Akualizae počáečnío sysému se provádí novými day, kdy se zároveň mění i srukura segmenu. Ta je založena na předešlé segmenai, ovšem bez zarnuí dynamiké složky ování objeků. Výsledky ak nevedou k opimálnímu prakikému využií znalosí získaný akualizaí vzorů ování sluků. Výše popsané sraegie je možné pojmou jako logiký vývoj saikéo algorimu k dynamikému. První sraegie, předsavená obrázkem -, má u výodu, že není náročná výpočeně, jelikož není prováděna akualizae daaminingovéo sysému. Mimoo nepožaduje změny v následný proese, kerým může bý projek markeingové kampaně pro jednolivé segmeny klienů. Její nevýoda je a, že neodkrývá současné endene, nepopisuje realiu a eoreiky vzao následně nelze doáze k reálným rozodováním. Carakerisiky segmenu ani odnoy proměnný se v čase nemění. Není možné zařadi nový objek.

4 Zde je možné při vyváření počáečnío sysému (s přilédnuím k arakeru da a prakikému využií výsledků) použí éměř jakoukoliv meodu slukování (jednolivé meody slukování jsou zmíněny v seki.4). Obr - První sraegie logikéo vývoje saikéo algorimu k dynamikému (*) C C n Druá sraegie užívá známé segmeny (vyvořené v předešlém období) a akualizuje (pouze však klasifikuje) pozie klienů mezi saikými segmeny dle akualizovaný odno proměnný (mění se odnoy objeků, ne však srukura segmenu). Nevýodou je, že vzory ování jsou v dynamikém prosředí s nejvěší pravděpodobnosí zasaralé, neakualizované, neodpovídají skuečnosi. Akualizují-li se objeky, měla by se akualizova i srukura sluků. Není možné zařadi nové objeky. Tao sraegie, znázorněná obrázkem -, byla použia například k vyvoření modelu pro získaní Life Time Value bankovní klienů meodou segmenae v Laen Gold nebo jednoduše meodou k-means (**). Při éo sraegii je nuné uží meodu, kerá je sopná na základě jiséo kriéria (například pravděpodobnosi příslušnosi ke každému segmenu) zařazova objeky v každém sledovaném yklu do příslušný segmenů. Obr - Druá sraegie logikéo vývoje saikéo algorimu k dynamikému... C C * ** C značí (v každém z první čyř obrázků) časový yklus. Příkazem pouze klasifikova.

5 Ve řeí sraegii vyvíjí uživael nový sysém. Nevýodou éo sraegie je výpočení a finanční náročnos a naví neefekivia práe, jelikož analyik zráí již získané znalosi z da. To v praxi znamená nově projekova následné proesy jako je například markeingová kampaň, jelikož segmeny budou mí pravděpodobně značně odlišné arakerisiky od segmenů získaný v předešlém yklu a naví na ně nebudou navazova. Akualizae nemá dynamiký araker, jelikož se provádí nová segmenae, kerá je pouze foografií siuae v jisém časovém okamžiku (obrázek -3). Mění se arakerisiky sluků, je možné zařadi nové objeky. Opě je možné použí éměř jakoukoliv meodu slukování. Obr -3 Třeí sraegie logikéo vývoje saikéo algorimu k dynamikému C C Poznámka: Přeškrnuá šipka značí, že neexisuje návaznos modelae z jednoo období do druéo. Sraegie, uvedená jako poslední, mění v každém yklu arakerisiky sluků na základě odno objeků a o opě jen v jisý momene v čase; může nebo se nemusí zakláda na segmenai vyvořené v předešlé eapě vývoje. Je možné zařadi nové objeky. Nevýoda spočívá ve skuečnosi, že uživael novéo sysému opě zráí možnos prakikéo využií znalosí získaný z předešlé segmenae. Po auomaiké akualizai sředů sluků je oiž nuné změni následné proesy, i když pravděpodobně uo modifikai není řeba provádě pro každéo kliena - ne vždy je nuná akualizae srukury segmenu, jelikož o moou bý právě jen nově zařazované objeky, keré nepřísluší do již vyvořený sluků nebo je o jen několik objeků, keré předsavují změnu (poyb). Cování objeků v průběu času zde není věnována pozornos. Pro realizai éo sraegie je používána meoda segmenae ve dvou fází v SPSS. Sraegie je zobrazena obrázkem -4.

6 Obr -4 Čvrá sraegie logikéo vývoje saikéo algorimu k dynamikému C C Sluky v C Ani jedna z výše uvedený sraegií nemá dynamiký araker, jelikož se nezákládá na dynamikém ování objeků, keré je nuné v případe měníí se arakerisik prosředí zarnou do akualizae formáů segmenů. Tyo sraegie a meody užívají dynamiké elemeny při aplikai slukové analýzy na akualizai saikéo daovéo souboru. Obená meodologie Daa Miningu, vyvíjena v éo prái, může bý aplikována na dynamiký daový soubor, kerý je arakerizován poyby objeků v čase. Meodologie, navrovaná v éo prái, na základě dynamikéo ování objeků idenifikuje, je-li nuná akualizae arakerisik sluků a akualizuje yo nejvodnějším způsobem. Akualizae vyází z efekivnío využií předozío sysému. Teno sysém má několik výod, například: je výpočeně výkonnější, finančně výodnější, není závislý na ypu aplikae, výsledky odpovídají skuečnosi a v neposlední řadě idenifikae zřejmý změn v sysému by mola vés k poopení budouí změn v příslušném prosředí (*)..4 Slukování objeků: konep a příklady V seki. bylo z absraknío úlu poledu definováno o, čím se rozumí slukování. Nyní je nuné eno konep rozšíři. Jsou sanoveny dva základní pojmy. Prvním je vlasní segmenae a druým je klasifikae objeků do říd [4][0][5]. * Další výody jsou odkrývány v průběu práe, především v seki 8 a srnuy jsou pak v seki 9.

7 Sluková analýza je časo definována jako nalezení přirozený sluků. Konkréně, ílem slukování je rozděli množinu individuí, objeků nebo pozorování (dále jen objeky) do akový sluků, kdy supeň přirozené asoiae pro každý objek je vysoký se členy svéo vlasnío segmenu a nízký se členy osaní segmenů [4]. Pravidla rozdělení množiny objeků do podmnožin jsou srnuy následovně: Podobné objeky jsou seskupovány do podobný říd; ao vlasnos se nazývá omogenia. Rozdílné objeky jsou rozdělovány do rozdílný říd; ao vlasnos se nazývá eerogenia. Klasifikae je proes zařazování objeků do řídy, kerou mají zaujíma. Dalším z úkolů slukování je naléz vzory ování, keré idenifikují arakerisiky množiny objeků. Jedná se o sloučení objeků do podmnožin, nazývaný sluky. Každá z ěo podmnožin je reprezenována jedním prooypem sanoven koefiien příslušnosi ke každému sluku [4]. S a pro každý objek je Mezi meodami segmenae se naázejí klasiké saisiké meody, jako je k-means, ierariká segmenae [0] nebo segmenae ve dvou fází. Meodami, vyvíjenými v oblasi umělé ineligene, jsou neuronové síě, auomaiké učení, meody difusní segmenae [] a další []. Vzory ování jsou deerminovány v refereni na konkréní aplikai [4]. Aby moly bý objeky klasifikovány, musí exisova řídy a jeji idenifikae [4]. V případě, kdy řídy nejsou známy a priori, jsou získány užiím algorimu segmenae [0] [7]. Příkladem je segmenae klienů v bane, kdy počáeční sav říd není znám, ale může bý získán aplikaí jiséo algorimu slukování; ak se získají sluky objeků a reprezenaivní vzory jeji ování. Je-li poče říd předem deerminován, jsou užívány algorimy segmenae jako je například k-means [9]. Jesliže poče říd není znám, je řeba jeji poče naléz a o algorimy jako jsou například ierariké slukování nebo segmenae ve dvou fází. Segmenae jako enika rozpoznání vzorů ování [7] je aplikována v mnoa oblase, jako je například diagnosika a léčení v mediíně, analýzy exu, předpověď

8 savu počasí, konrola proesů, zpraování neurologiký signálů, analýza foografie pozemku, analýza přírodní zdrojů, deeke a klasifikae sonarů, rozpoznání oisků v dakyloskopii a další [4]. Její explozivní využií v současné době regisruje oblas Business Inelligene; ypikým příkladem jsou nejrůznější sraegie segmenae klienů finančně orienovaný insiuí..5 Dynamiké ování sluků a objeků V éo seki je podrobně vysvělen konep dynamikéo ování, užií dynamikéo algorimu a rozlišeny siuae, keré závisí na exiseni idenifikáoru. Změny ve sluí jsou způsobeny změnami v někerý nebo ve vše proměnný sudovanéo objeku. Množina klienů banky periodiky informuje o změná přijmu. Tao informae je akualizována a proo je o jedna z dynamiký arakerisik, kerá je v průběu času doplňována do báze da. Jiné arakerisiky, jako je například věk klienů, jsou akualizovány auomaiky, je-li známo jeji daum narození. Objeky, keré exisují v bázi da, se pojmenují známé objeky. Tyo byly v nějakém momenu podrobeny segmenai a proo je známo, do jaké řídy paří. Objeky, keré se agregují do báze da, se nazývají agregované objeky. V každém časovém období jsou odnoy proměnný obou ypů objeků akualizovány (o vyjadřuje dynamiké ování objeků) a yo moou bý pak nazývány objeky akualizované. Aby bylo možné rozliši siuai akualizae a agregae, je řeba vlasni arakerisiku regisru, o znamená adresu, kerá dovoluje idenifikova objek. Teno regisr je pojmenován idenifikáor. V případě bankovní klienů je o občanské číslo nebo rodné číslo [6]. Z poledu exisene idenifikáoru je řeba vzí v úvau dvě alernaivy sledování dynamikéo ování, keré mají speifiké subproblémy a vyžadují rozdílná zaázení; jsou jimi [5]:. Případ, kdy neexisuje idenifikáor, proo neexisuje kriérium jak rozliši mezi objeky agregovanými a známými. V obodní dome věšinou nejsou ukládána jména a idenifikae klienů, keří nakupují, a proo vždy, kdy jde klien nakupova, je eno považován za nový objek, kerý se může ova rozdílně než v předozí siuai

9 a evenuelně může bý spojován s jinými sluky podle ypu své denní spořeby. Při omo omezení nedoází k akualizai proměnný objeků; objeky se pouze agregují. Z konepuálnío poledu je řeba s ěmio podmínkami vyvoři inerpreai změny a doíli zarnuí efeku změny do vzorů ování. Analýza spojená s ímo ypem problému vede ke zráě informae - například ve dvou rozdílný sekvenční období jsou rozpoznány jako ideniké řídy y, keré se mezi sebou poybují jen málo (obrázek -5). U objeků není možné definova rajekorie poybu. Trajekorie se idenifikují podle poybu říd. Obr -5 Příklad idenifikovaný rajekorií vývoje srukury sluků v čase Idenifikované rajekorie sluku Sluky C C+ C+ C+3 C+4 C+5 Časové ykly Poznámka: C vyjadřuje časové ykly, černá spojnie vyjadřuje ypoézu o vývoji sluků v čase.. Příklad, kdy exisuje idenifikáor, edy paměť regisru pro každý objek (obrázek -6). Hodnoy aribuů každéo objeku je možné akualizova a udíž jsou sledovány skuečné rajekorie poybu objeků vyjadřujíí dynamiké ování. Příkladem jsou bankovní klieni, keří mají rodné číslo a každý z ni je arakerizován proměnnými, jako je příjem nebo věk, keré se akualizují v čase. Kromě akualizae známý objeků je možné sledova agregované objeky a jeji vliv (změny, keré produkují ve srukuře říd) analyzova.

0 Obr -6 Příklad skuečný rajekorií vývoje ování objeků a srukury sluků v čase Skuečné rajekorie sluku Sluky C C+ C+ C+3 C+4 C+5 Časové ykly Poznámka: C vyjadřuje časové ykly, černá spojnie reprezenuje reálné rajekorie..6 Definie dynamikéo slukování Tradiční meody segmenae neuvažují jako vsupní daa vývoj objeků v čase []. Jeji algorimy, keré mají saiký araker, se aplikují na analyzované objeky v jisém deerminovaném okamžiku bez zařazení dynamiké formy akualizae či agregae objeků. Naproi omu algorimus segmenae je dynamiký, jesliže je sopen dynamikou formou zařadi akualizae či agregae objeků vyplývajíí z dynamikéo arakeru ování objeků pro znovudefinování přirozený sluků. Pro vyvoření dynamiké segmenae je řeba sanovi podmínku, že pro každý objek i sluk je nuné sledova vekory proměnný v čase. Proo pod pojmem dynamiké slukování se budou rozumě akové algorimy, keré dovolí sesroji rajekorie ování v čase (*) a na základě jeji analýzy akualizova vzory ování sluků, vyázejíí z akualizae realizované v předešlém yklu. V důsledku oo se dynamiká segmenae ransformuje v nový násroj slukování, kerý dovolí získa reprezenai vzorů dynamikéo ování objeků či sluků; jako aplikae významně rozšiřuje kapaiu algorimů saiké segmenae a znalos o dae. * V případě objeků bez idenifikáoru rajekorie ování sluku v čase a v případě objeků s idenifikáorem naví rajekorie ování objeků.

Příklady aplikaí, kde je důležié uvažova rajekorie a ne jen jednolivé body, jsou [3][]: Moniorování paienů v mediíně, speiálně v inenzivní léčení, kde sledování jeji savu a změn v čase je podsané. Klasifikae akií na burze. Sledování rajekorií en a další arakerisik akií směřuje k přesnějším odadům než při uvažování poué akuální eny akií.

CÍLE. Obený íl Hlavním ílem je zkonsruova obenou meodologii, použielnou pro analýzu slukování, založenou na dynamikém ování objeků, kerá deekuje změny ve sluí a akualizuje vzory ování sluků opimálním způsobem. Její realizae bude vyáze ze srukury sluků vyvořené v předozí období.. Speifiké íle Idenifikova sénáře změny. Definova eapy proesu. Vybra meody a vyvinou kriéria pro deeki změn v odnoá objeků ak jako i ve složení říd. Implemenova obenou meodologii na dae simulovaný a skuečný. Navrnou a vyodnoi způsob srovnání sraegie saikéo slukování s obenou meodologií dynamikéo slukování. Ukáza inovae, výody a užií navrované meodologie.

3 3 METODOLOGIE PRÁCE Cílem diserační práe je zkonsruova obenou meodologii. Proo jako meodologie práe je považován proes vývoje eap proesu a jeji součásí, keré vedou k rozodnuí o aplikai někeréo z definovaný sénářů změn. Meodologie spočívá v návru algorimu, kerý prosřednivím meod a kriérií podpoří auomaiký sekvenční proes akualizae srukury sluků da v různý časový ykle. Důležios vývoje auomaikéo proesu akualizae vzorů ování spočívá ve vyvoření násroje, kerý by byl sopný dle sandardní meodologie analyzova siuai a zvládnou změny prosředí. Původní srukura sluků je získána prosřednivím slukování da před první akualizaí či agregaí objeků. Událosi prosředí předpokládají změny ve srukuře sluků, je-li ování objeků známý či agregovaný rozdílné od oo v yklu předozím. Relevanní úsilí obené meodologie proo spočívá v deeki rozdílnéo ování a doílení adekvání dynamiké akualizae, vyázejíí ze známý vzorů ování a o všeno prosřednivím auomaikéo proesu. Jelikož ílem práe je vyvinou obenou meodologii, meodologie práe bude s deaily popisována přímo při jejím vývoji v seki 5 a 6. 3. Vymezení práe S aplikaí obené meodologie se začíná v momenu, kdy se akualizují objeky (po výběru opimálnío poču sluků); objeky mají idenifikáor. Ješě před konsrukí meod a kriérií užívaný v obené meodologii je řeba a priori zvoli algorimus segmenae, kerý je aplikován na objeky při jeji slukování; ransformuje se ak v čásečné omezení problému - aké volba meod a vyvíjení kriérií jsou omezeny algorimem segmenae; eno vza plaí i naopak. Konkréně, ke sanovení opimálnío poču sluků je vybrán algorimus segmenae ve dvou fází a k vyváření akualizae formáů ování sluků je zvolena meoda segmenae k-means; k realizai meod je využi sofware SPSS. Jelikož náplní práe není sanovi opimální poče říd a povaa da, se kerými se prauje,

4 odpovídá zvolené meodě, výběr algorimu k-means pro vývoj obené meodologie je v éo prái zdůvodněn. Pro elou analýzu se předpokládá, že se nezařazují nové proměnné (aribuy arakerizujíí objek) k ěm, keré byly vybrány na počáku sudia. Všeny užié proměnné mají spojiý araker. Daa užiá na esování obené meodologie poázejí ze dvou zdrojů; jedním jsou daa simulovaná a druým jsou daa získaná z Bi v Saniagu, Cile eno zdroj bude s deaily vysvělen v seki 7.. Vyvíjená obená meodologie je úvodem do dynamiké segmenae - má za úkol navrnou sénáře změn a eapy průodem ěo sénářů, nemá však za úkol vyčerpávajíím způsobem vyřeši všena možná řešení ani vybra nejadekvánější meodu či kriérium zpraování informae. Úkolem aké není programova algorimus obené meodologie. Je řeba zdůrazni, že záměrem konsruke obené meodologie je prakiky ji využí. Proo zvolené posupy, keré vedou k rozodování o akualizai vzorů ování sluků (založené především na meodá a kriérií uvniř eap) jsou konsruovány nejen s úmyslem inovova algorimy slukování Daa Miningu, ale především pro účely reálné aplikae obené meodologie v praxi Business Inelligene.

5 4 PLÁN PRÁCE Plán práe se skládá ze dvou čásí; první, kerá zarnuje permanenní revizi lieraury a druá, plán pokroku práe v čase. 4. Permanenní revize lieraury Permanenní revize lieraury zarnuje revize následujíí časopisů: Analýza ineligene da, IEEE Transaions on K-means, IEEE Transaions on Evoluionary Compuaion, IEEE Transaions on Paern Analysis and Maine Inelligene, IEEE Transaions on Sysems, Man, and Cyberneis, Par A: Sysems and Humans, IEEE Transaions on Sysems, Man, and Cyberneis, Par B: Cyberneis. Tyo časopisy předsavují pokroky v enikém a aplikovaném výzkumu v oblase spojený s konepy a algorimy, keré jsou později aplikovány v Daa Miningu. Rozvíjejí posupy a meody ve saisie, informaie, umělé ineligeni a další odvěví, keré jsou aplikovány při rozpoznání vzorů ování. 4. Plán pokroku práe na diserační prái Plán pokroku práe v čase dovoluje měři supeň pokroku v realizai práe. Jako lavní úseky zarnuje následujíí eapy: Pravidelné sůzky s profesory na Universidad de Cile: s profesorem řízení operaí a Daa Miningu Jaimem Mirandou, profesorem markeingu Maximo Bosem a profesorkou saisiky Nany Laourly. Paralelně jsou organizovány sůzky s Luisem Aburem (ředielem Daa Miningu v Pena/Analyis, firma zabývajíí se poskyováním služeb Daa Miningu a Business Inelligene) a Andreou Romero (konzulorkou firmy SPSS).

6 Konzulae někerý eap práe s analyiky a modeláory z oddělení Ineligene obodů, Markeingu a Korporaivnío Daa Wareouse, Bi. Korespondene se školielem do. Ing. Oakarem Maáčkem, CS. Definie pojmu změny v ování objeků a siuae odvozené ze změn. Definie meod a kriérií, keré dovolí idenifikova změny v ování skupin objeků. Definie obené meodologie, její eap proesu a sénářů změn, keré logikým sekvenčním způsobem dovolí pozna globální ování objeků a sluků a idenifikova možné změny ve srukurá sluků. Vývoj obené meodologie užiím výše uvedený defini, keré dovolí akualizova srukuru sluků na bázi dynamikéo ování objeků. Aplikae obené meodologie na simulovaná daa. Aplikae obené meodologie na reálný případ. Pozorování ování sluků a obený arakerisik obené meodologie a analýza výsledku aplikae obené meodologie včeně odadu a sledování endení budouío vývoje. Návr a provedení srovnání a vyodnoení obené meodologie a algorimu saikéo slukování. Zodnoení výod, přínosu a užií obené meodologie. Každá eapa plánu práe je doplňována konrolami referáů o čásečný pokroí.

7 5 DEFINICE OBECNÉ METODOLOGIE DYNAMICKÉ SEGMENTACE PRO PŘÍPAD OBJEKTŮ S IDENTIFIKÁTOREM Změny v okolí, keré se odrážejí v ování objeků, způsobují změny ve srukuře sluků definovaný prosřednivím algorimu segmenae. Proo úsilím při vývoji obené meodologie je ukáza evidenní dynamiké změny v objeke doprovázené změnami v arakerisiká segmenů; jsou jimi například efeky změn sředů sluků, příslušnosi objeků do sluků či poče sluků. Teno problém je možné pojmou z poledu vzorů ování úsilí pak spočívá v přenesení změn v objeke na reprezenai vzorů ování získanou předešlou segmenaí. Obená meodologie, jejímž záměrem je vypořáda se se změnami v okolí a edy přenés yo změny do arakerisik sluků, spočívá v sérii sekvenční eap, keré dovolují čeli různým sénářům změn ve vzore ování sluků. Tyo eapy mají bý zkonsruovány z meod a kriérií, keré mají efekivně a auomaiky pomáa rozodova. Pro navržení a realizai meod a kriérií je řeba v každé eapě definova vsupy, jejiž forma je podřízena například ypu da i eapě, ve kerý budou figurova. Uvniř eap je řeba aké idenifikova rozdílné možnosi řešení podporované meodami, keré pomoí kriérií definovaný v podmínká eap dovolí vybra pro každou eapu nejopimálnější řešení ze vše. Sejně ak je řeba definova dru výsupu, kerý bude slouži jako vsupní informae pro nadázejíí eapy. 5. Sénáře změn ve vzore ování sluků Nezávisle na eapá proesu (*), meodá a kriérií řešení je řeba idenifikova sénáře změn, keré moou nasa ve vzore ování sluků. Idenifikované sénáře změn ve sluí jsou následujíí (obrázek 5-): a) Zaování poču sluků. Objeky servávají v někerém z exisujíí sluků. Oázka, kerou je řeba v omo sénáři zodpovědě je, zda-li bude realizována * Eapa proesu neboli eapa idenifikae sénářů změn nebo jen eapa.

8 aková akualizae sluků, kerá obraným způsobem využije informae akualizovaný a/nebo agregovaný objeků; v kladném případě řešení je řeba sanovi způsob akualizae vzorů ování. b) Tvorba nový sluků. V omo sénáři se objevují nové segmeny kromě ě již exisujíí. Proo agregované či akualizované objeky se zařazují do exisujíí sluků či do nový sluků. Úsilím je vyřeši, v jakém případě a jak naruši srukuru říd a jak slouči již vyvořené vzory ování s ěmi novými. ) Zrušení sluků. Neexisují žádné nebo dosaečný poče objeků, keré jsou zařazovány do známéo sluku. Jedním z úkolů je sanovi v jakém momenu je řeba naruši srukuru sluků vyloučením ě, keré počíají s nedosaečným množsvím objeků nebo nepřijímají známé či agregované objeky a o děla s dodaečnou informaí, kerou by měly pojmou eliminované sluky. Obr 5- Akualizae vzorů ování sénáři změn Definovaná obená meodologie uvažuje provedení sekvenční eap, keré dovolují realizova globální analýzu objeků a dovés analyika k výběru opimálnío sénáře změny. 5. Eapy idenifikae sénářů změn Dynamika každé eapy obené meodologie (kromě é poslední) je reprezenována rozodovaím sromem ilusrovaným v obrázku 5-. V každé eapě je dána vsupní informae, kerá je vořena day (a jeji omezeními při jeji zpraování a užií v možný

9 volbá rozodování); konkréně, vsupy voří arakerisiky objeků ve sluí jako je například příslušnos a vzdálenos každéo objeku k určiému sluku získanéo prosřednivím aplikae algorimu segmenae nebo odnoy proměnný objeků v každém sledovaném yklu. Po vsupu informae přijde na řadu její zpraování. Too zpraování může bý ak jednodué jako je počíání objeků, určení pořadí informae či ake složiější jako je aplikae určié meody, kerá by zpraovala informai o každém objeku. Meody doprovází podmínky řešení a jeji kriéria. Jakmile je informae zpraována, nabízí se vějíř různý možnosí rozodnuí. V každé eapě (kromě é poslední) je řeba vybra jednu z ni. K rozodnuí výběru nejlepší variany může dojí buď prosým výběrem na základě logiký kriérií a nebo je řeba vyvoři určiý index (kerý bývá uveden v definií podmínek řešení jako kriérium vyvářené pomoí koefiienu jisé ranie rozodování), kerý dovoluje srovnáva možnosi mezi sebou ím způsobem, že raionální rozodovael se rozodne pro u, kerá nabízí nejlepší či nejvodnější způsob akualizae. Kriériem může bý například čas, kerý pořebuje algorimus na zpraování informaí, sabilia poybu objeků, omogenia segmenů, kvalia segmenae a další. Výsup z jedné eapy může voři vsupní informai pro další eapu. Obr 5- Séma dynamiky eapy proesu Rozodnuí Vsupní informae Zpraování vsupní informae Rozodnuí Výsupní informae Rozodnuí n Aplikae sekvenční eap dovoluje deailně pozna siuai a v posloupnosi čeli možným sénářům změn. Teno sekvenční způsob inegrae poznání a rozodování

30 dovoluje uží jasná kriéria, kerá jsou jednoduše aplikovaelná a modifikovaelná a dovolují akualizova současnou srukuru sluků opimálním způsobem. Před popsáním jednolivý eap sénářů změn je vodné předesla, že v éo seki je idenifikována každá eapa se svým příslušným posláním jak obeně ak již se zaměřením na konkréně aplikované meody a kriéria v seki 7; definie a implemenae každé eapy v algorimu obené meodologie je předvedena v seki 6 a 7. Sekvenční eapy proesu obené meodologie jsou následujíí (obrázek 5-3): I. Eapa: Idenifikae objeků, keré předsavují změnu. Tao eapa přísluší aplikai meod a kriérií, keré pro každý objek dovolí rozodnou, zda-li jeo ování předsavuje změny v relai ke srukuře planý sluků ekvivalenně ke známým vzorům ování. Kriéria mají jako vsup odnoy vzdálenosi objeků ke sředu příslušnéo sluku (*). Je definováno, že objek předsavuje změnu, je-li jeo ování eerogenní od ování původní objeků v segmenu. Je sanovena jisá ranie eerogeniy. II. Eapa: Rozpoznání savu změny. Vsupy jsou vořeny počem objeků ve sluí, kerým byly idenifikovány objeky se změnou. S ouo informaí je možné analyzova objeky, keré předsavují změnu, například meodou souču ěo objeků. Jedna z forem sanovení kriéria na eno příklad je definova, že nerelevanní změna nasává edy, kdy poče objeků ve sádiu změny je nevýznamný vzledem k elku objeků a poom edy relevanní změny ve známé srukuře sluků nasávají v případě, kdy poče akualizovaný či agregovaný objeků předsavujíí změnu je významný. To podněuje k definii kriéria ranie změny. III. Eapa: Rozodnuí o možnose akualizae sluků. Po idenifikai objeků se změnou a po rozodnuí o rozpoznání savu změny je řeba rozodnou o možnose opimální reprezenae změn deekovaný v objeke vzledem ke srukuře říd vyvořené v období předázejíím akualizai. Možnosi, keré se berou v úvau, jsou: zaova poče říd a pouze klasifikova objeky bez * Příslušným slukem pro objek se rozumí jemu nejbližší sluk.

3 speiální modifikaí současný vzorů ování, ož je pojmenováno meaniká akualizae doází k ní v případe enropikéo ování objeků ve smyslu jeji poybu nebo/a směru; jiná alernaiva v rámi zaování poču sluků je akualizova využiím informae předešlé a naví é, kerou přispívají akualizované objeky a o prosřednivím exkluzivní eurisiky vodné pro každý jednolivý případ; ao forma akualizae je pojmenována ineligenní akualizae. Ineligenní akualizae vyváří efek změn uvniř sluků nazvanéo poyb sluků. V případě, kdy není idenifikován žádný objek se změnou nebo není rozpoznán sav změny, je volena jedna z výše uvedený alernaiv, jejíž výběr závisí na enropii ování vše objeků ve smyslu jeji poybu a směru. Je definován neenropiký poyb a směr a aké kriéria a koefiieny ranie sabiliy objeků. V případě, kdy je rozpoznán sav změny, je vybrána buď ineligenní akualizae nebo druá možnos, kerou je vorba nový sluků, kdy je zvyšován poče sluků a ledána nová segmenae. Je sanoveno kriérium a koefiien ranie sabiliy oulierů a ranie vorby nový sluků. Realizae každé uvažované možnosi je omezena na meody a algorimus slukování, keré užívá každý modeláor; například pro volbu vorby nový sluků (jeji poču) je možné uží algorimus, kerý auomaiky, na základě da, vybere opimální uspořádání říd a najde příslušnos objeků do nový říd. Sejně ak v případě poybu říd exisují meody, keré dovolí doíli opimálnío rozložení sávajíío poču segmenů. Deailní arakerisiky vsupů, meod a kriérií, keré je řeba pro eapu definova, jsou vysvěleny v seki 6.3. IV. Eapa: Zánik sluků. Poče objeků spolu se znalosí reálný rajekorií objeků a sluků slouží jako vsupní informae a kriérium pro zrušení říd, keré nesplňují podmínky pro přežií segmenu. V éo prái je řída kandidáem na své vyloučení, nemá-li dosaečný poče objeků a zároveň nebyl-li jí přirazen po jisý poče yklů akualizae vzorů ování žádný objek. Jsou proo definovány ranie minimálnío možnéo poču objeků a ranie času pozorování.

3 V. Eapa: Idenifikae rajekorií. Cílem éo eapy je idenifikova novou srukuru sluků s ou bezprosředně předázejíí a o konsrukí reálný rajekorií poybu, keré ukazují, keré řídy a jakým způsobem byly akualizovány. Vsupy jsou vořeny předozí a novou srukurou říd získanou prosřednivím algorimu obené meodologie. V průběu času je možné sledova endeni a sabiliu poybu sluků, ož je důležiá informae pro realizai předpovědí do budounosi. Obr 5-3 Eapy proesu obené meodologie s indikaí rozodování dle kriérií pro někerý z ypů akualizae vzorů ování yklus Eapa I. Eapa II. Eapa III. Eapa IV. Eapa V. Výběr sénáře změny Výběr sénáře změny kriérium ANO NE kriérium NE ANO kriérium kriérium NE ANO ANO NE M I I NT kriérium NE ANO NZ Z Trajekorie Poznámka: M je meaniká akualizae, I je ineligenní akualizae, NT je vorba nový říd, N je zrušení sluků, NZ je negae zrušení sluků. Aplikae obené meodologie začíná v momenu, ve kerém se realizuje akualizae či agregae objeků. Konkréně, vyvořená obená meodologie je aplikována na koni každéo yklu (po klasifikai objeků) pro každý sluk zvlášť, kdy je analyzován sav a ování objeků a v rámi sénářů změn vybírány formy akualizae formáů ování sluků. Cyklus sledování objeků a segmenů v rámi obené meodologie dynamiké segmenae je ukončen realizaí poslední, páé eapy. Tao eapa je sournem a výsledným savem aplikae dynamiké segmenae a udíž všena nuná rozodování jsou provedena již před ouo eapou (běem první čyř eap). V eapě III. je nalezena nejvodnější

33 alernaiva akualizae sluků. Neprojde-li analyik eapou IV., nemůže bý dokončen výběr sénářů změn a akualizae vzorů ování (*). Jak bude ukázáno v seki 6 a 7, sénář Zaování poču sluků či Tvorba nový sluků se navzájem vylučují, nevylučují však sledování a aké následnou aplikai řeío možnéo sénáře změny, kerým je Zrušení sluků. * Termín akualizae sluků se užívá pro ři alernaivy akualizae sluků definované v eapě III. v rámi dvou sénářů změn. Termín akualizae vzorů ování sluků je ermín obený, kerý zarnuje aplikae vše definovaný sénářů změn.

34 6 VÝVOJ OBECNÉ METODOLOGIE DYNAMICKÉ SEGMENTACE PRO PŘÍPAD OBJEKTŮ S IDENTIFIKÁTOREM A SHLUKOVÁNÍ REALIZOVANÉ PROSTŘEDNICTVÍM ALGORITMU K- MEANS Tao seke předsavuje vývoj obené meodologie (*) pro případ objeků s idenifikáorem aplikaí algorimu k-means. Je připomínáno, že obená meodologie je úvodem do dynamiké segmenae - má za úkol navrnou sénáře změn a eapy průodem ěo sénářů, nemá však za úkol vyčerpa všena možná řešení. 6. Eapa I: Idenifikae objeků, keré předsavují změnu Změna pozie fyzikéo objeku je deekována v případě, je-li objek přemísěn vzledem k jisému servačnímu sysému, kerý se poybuje sejnou rylosí jako sysém referene sledovaele []. Sejným způsobem je možné vyuši, že objeky předsavují sádium změny, přemísí-li se vzledem k určiému referenčnímu sysému modelovanéo jisou aplikaí. Referenční sysém je arakerizován srukurou známý říd před inkorporaí jakýkoliv změn. Je sanoveno, že objek je ve savu změny vzledem ke sanovené refereni, splní-li definovaná kriéria změny. Původní sluky jsou vořeny známými objeky, jelikož vyváří srukuru sluků, kerá je známá a známý je i koefiien jeji příslušnosi do sluků, ož je jeji vzdálenos ke sředům sluků. Sluky, vořené známými objeky, jsou arakerizovány průměrnými odnoami vše aribuů objeků před momenem, kdy se produkuje první akualizae známý objeků či agregae nový objeků. Celek známý objeků má velikos N a elek agregovaný objeků má velikos N. Celkový poče objeků je N ( N = N + N ). Je definována X jako maie N x M odno známý objeků, kde každá řádka obsauje objeky a sloupe vyjadřují odnoy proměnný objeku Χ, jejiž příslušnos do říd je v případě algorimu k-means exkluzivní, edy každý objek je zařazen právě do * Vývoj obené meodologie je meodologií práe. Při jejím posupném sledování je vodné konzulova sourn symbolů, defini a paramerů z příloy..

35 jedné řídy. Poom řídy nemoou mí žádný objek společný a všeny řídy společně musí voři elek objeků []. Y je maie N x M agregovaný objeků, kde každá řádka obsauje objeky a sloupe vyjadřují odnoy proměnný objeku Y ; jsou o objeky agregované k elku známý objeků a yo dva ypy objeků moou předsavova změnu vzledem k exisujíí srukuře říd (*). Je sanoveno, že známý objek Χ je reprezenován vekorem proměnný v M dimenzí, pak Χ R M. Teno známý objek přispívá svými změnami k akualizai informae ve řídá ak jako objek Y R M, kerý se agreguje do množiny X. Je řeba měři, jak odlišný je akualizovaný známý či agregovaný objek vzledem k exisujíím řídám a aké vyřeši problém jak akualizova ímo novým přídělem informae, ož přísluší problému akualizae ve vzore ování. Sluk je označen S, kde {,..., S} ; jeo srukura je vořena vekory známý objeků z maie X, po agregai aké odnoami objeků z maie Y. Celek sluků je označen CS { S / {,..., S } =, sřed sluků pak s. Meoda k-means je založena na zařazení každéo objeku do sluku, jeož sřed se naází nejblíž. Sřed sluku je definován jako M rozměrný bod, kerý vznikl průměrováním odno každéo objeku segmenu v každé dimenzi []. Je počíána vzdálenos d s m, s ) mezi sředy říd S m a S n, {,..., S}, kde m n ( n m, n. Vzdálenos mezi známým Χ či agregovaným objekem Y a sředem sluku je definována jako d Χ, s ) nebo d Y, s ). Vzdálenosi jsou ( ( v éo prái vypočeny Eukleidovou vzdálenosí (v příloze. jsou uvedeny osaní meody výpoču vzdálenosí a případy jeji použií), druou odmoninou ze sumy čverů rozdílu mezi odnoami proměnný objeků a sředu sluku (či sředů sluků navzájem). V dvourozměrném prosoru je o přepona pomyslnéo rojúelníku, jeož odvěsny se získají jako rozdíly odno proměnný z konrasovaný objeků []. Obená forma zápisu vzdálenosi mezi objekem Χ a sředem sluku s ve formě Eukleidovy * Objeky Χ a pouze objeky). Y jsou ve skuečnosi vekory objeků i přes všeny proměnné (zde pojmenovány

36 vzdálenosi je následujíí: d M ( Χ, s ) = ( Χij Χ j ). j= Příslušnos objeku Χ k příslušnému sluku S je označena a definována následovně: Χ S jesliže d( Χ, s ) d( Χ, s ), kde s je sřed konkrénío, < segmenu a s je sřed jakéokoliv segmenu (plaí i pro Y ). 6.. Definie (*) idenifikae objeků předsavujíí změnu Definie : Idenifikae objeků, keré předsavují změnu. Jako objeky, keré předsavují změnu, jsou idenifikovány objeky známé i agregované, keré splňují podmínku. Podmínka : definie kriéria ranie eerogeniy Je dán sluk S, yklus C a období l. Je definováno po { po d po max s max d, s } = Χ. i Poom S, Χ i S jsou objeky předsavujíí změnu idenifikovány podmínkou : kon, po po max s Podmínka : d( Χ s ) > d. Vzdálenos po max s d reprezenuje ranii eerogeniy. Je o vzdálenos nejvzdálenějšío známéo objeku po Χ ke sředu s svéo příslušnéo sluku S v období kon před modifikaí po. d ( Χ, s ) je vzdálenos akualizovanéo Χ (nebo agregovanéo Y ) objeku v období kon od sředu s příslušnéo sluku S vyvořenéo v po (pojmy yklus a období jsou vysvěleny v seki 6.3). Podmínka, vzaujíí se k první definii, * Všeny definie se vzaují k poslednímu období každéo yklu. Jelikož záměrem je nepřeli ex a ak nerozpýli uživaele éo diserační zaížením symbolů všemi indexy, keré by yo měly v přísném režimu vlasni, nejsou všeny koefiieny do exu zařazeny s výjimkou případů, kdy analiik považuje přesný zápis za nezbyně nuný. Too usanovení se vzauje na elou diserační prái.

37 vyplývá z faku, že akualizovaný nebo agregovaný objek přesane přísluše do sluku a ak předsavuje změnu, překročí-li v odnoeném období jeo vzdálenos od sředu sluku ranii nejvzdálenějšío známéo objeku od sředu éže řídy sledované na počáku yklu. Akualizované a agregované objeky se v posledním období akuálnío yklu klasifikují do nejbližší exisujíí sluků. Až eprve po zařazení objeků se provádí aplikae kriérií sanovený podmínkou : jsou počíány vzdálenosi mezi objeky a sředy příslušný sluků a porovnávány s d po max s. Objeky, jejiž vzdálenos ke sředu sluku přesauje ranii eerogeniy, jsou objeky předsavujíí změnu a pojmenovány ouliery (zobrazeny v obrázku 6-). Ouliery jsou zapisovány o X (*). Obr 6- Objeky sluku ouliery Ouliery jsou objeky, keré nemají sejné ování jako zbyek pozorování; jsou o objeky s eerogenním ováním. Nejsou ypikými objeky pro populai. Analyik může ouliery eliminova nebo je může zařadi do analýzy, jelikož moou obsaova reprezenaivní inerpreai jiséo dominannío segmenu. V éo eapě bude každý oulier - deerminovaný podmínkou z definie - zařazen do analýzy a vyodnoen v další eapá. Exisene oulieru je v posloupnosi obené meodologie první známkou možné změny ve srukuře sluku. * Ta samá podmínka plaí i pro objeky Y a jeji ouliery, zapisované o Y.

38 Vsupy pro uo eapu jsou vořeny odnoami vzdálenosí vše objeků od sředů svý příslušný sluků před i po modifikai příslušnosi objeků ke slukům. Meodou pro vyodnoení kriéria na idenifikai objeků se změnou je výpoče a porovnání Eukleidový vzdálenosí. V éo eapě exisují dvě možnosi rozodnuí. V případě, že nejsou idenifikovány žádné objeky, keré předsavují změnu, doází k meaniké či ineligenní akualizai sluků (přeází se do seke 6.3). V případě idenifikae objeků se změnou se posupuje do seke 6.. 6. Eapa II: Rozpoznání savu změny Dalším úkolem ve vývoji obené meodologie je návr meodiky, kerá na základě analýzy eerogenní objeků rozpozná sádium změny ve srukuře exisujíí říd. Ne auomaiky je informae o objeke, keré jsou idenifikovány jako objeky ve savu změny, zařazena do vzorů ování. Jelikož úsilím je udrže o možná nejsabilnější markeingovou kampaň (jako jakýkoliv proes pos segmenae, kerý je definován na základě arakerisik sluků), záměrem je provádě pouze nevynuelné změny ve vzore ování; zároveň je však nuné respekova reálné a podsané změny v okolí a přenáše je do arakerisik sluků. Sádium změny ve srukuře sluků je rozpoznáno v om případě, je-li poče oulierů vzledem k elkovému poču objeků významný. Poče oulierů v segmenu označen S bude o e S. V omo případě budou upřednosňovány záměry markeingu (před saisikými kriérii analýzy) a bude uvažována změna markeingové kampaně a edy i změna v arakerisiká sluků v případě, budou-li náklady na změnu vykompenzovány výnosnosí kampaně (*). Jedna z forem, jak vyjádři kriéria rozodování éo eapy je pomoí podmínky. * Předpokládá se, že výnosnos kampaně bude v podsané míře závise na objemu reakí.

39 6.. Definie rozpoznání savu změny Definie : Rozpoznání savu změny. Je rozpoznán sav změny, jesliže poče objeků předsavujíí změnu vzledem k elkovému poču objeků ve sluku je věší než jisá ranie změny. Podmínka : definie kriéria ranie změny o S, Χ i S plaí: o es Podmínka : > α, kde 0 < α <. N S Koefiien α předsavuje ranii změny. Definie je vyvořena na základě faku, že ke skuečné změně nedoází, neexisuje-li dosaečná příčina změny vzorů ování, edy dosaečný poče objeků se změnou. Pro podmínku je řeba definova koefiien α, kerým může bý například 0%: je-li v segmenu poče oulierů vyšší než 0% vše analyzovaný objeků, j. objeků známý či agregovaný včeně oulierů, je splněna podmínka a rozpoznán sav změny. K podmíne je nuné doda, že ne ve vše proměnný, arakerizujíí objek, musí doáze ke změně. Jsou-li objeky arakerizovány mnoa proměnnými, jsou vybrány jen někeré z ni, keré mají určujíí význam ve sledování objeků. Ve věšině úlo je segmenae vořena nízkým počem aribuů a ak nepřináší aos do segmenae. Exisují případy, kdy sluk je arakerizován mnoa aribuy, z niž věšina je považována za doprovodné - při sledování poybu sluků jsou zanedbané, jelikož při vorbě následný proesů je řeba se sousředi na jednoznačná kriéria. Bude závise na markeerovi, analyikovi a aplikai, jak bude v akovém případě rozodnuo (oo vrzení se ýká i rozodování v seki 6.3). Vsupy pro uo eapu jsou vořeny počem vše objeků a zvlášť oulierů. Jsou analyzovány pouze sluky vlasníí objeky ve savu změny. Meodou na sanovení podmínky je prosý souče objeků se změnou a elkovéo poču objeků pro každý segmen.

40 Při nesplnění podmínky přiází v úvau ineligenní nebo meaniká akualizae sluků. Je-li splněna podmínka, je povrzen sav změny, edy změny ve formáe ování. To však auomaiky neznamená, že je nuné zvýši poče říd, jelikož en akuální může dobře reprezenova novou informai. Na vyřešení navržený problémů formy akualizae segmenů je nuné posoupi do následujíí, řeí eapy. 6.3 Eapa III: Rozodnuí o možnose akualizae sluků V éo eapě je vybrán jeden ze dvou sénářů změn: Zaování poču sluků nebo Tvorba nový sluků. Rozodnuí spočívá ve výběru opimální možnosi akualizae sluků založené na daný kriérií přiřazený ke každé možnosi. Celá myšlenka definova různé formy akualizae formáů ování vyplývá ze zarnuí konepu dynamiky ování objeků ve sluí. Vzory ování definovaný sluků nejsou porušeny, není-li na základě jisý kriérií prokázána endene v poybu a směru významnéo poču objeků. V případe, kdy je deekován významný poče objeků, keré vykazují neenropiký poyb a směr, mění se vzory ování segmenu. Naví, je-li ování významnéo poču objeků sluku eerogenní bez prokázání evidenní endene v ování povšenéo (*) poču objeků sabilní v poybu, je řeba yo objeky odděli a vyjádři ak rozdílnos jeji ování porušením akuální říd a vyvořením říd nový. Výše popsané v podsaě zarnuje analyzova objeky ve smyslu eerogeniy a enropie - poybu a směru - jeji ování. 6.3. Definie akualizae klasifikaí do říd V rámi možnosí zaování poču sluků je možné zvoli meanikou akualizai, kerá spočívá v klasifikai agregovaný a akualizovaný objeků do příslušný sluků, přičemž nedoází ke změně sředů sluků. Tako je rozodnuo pro sluky, kerým nejsou idenifikovány objeky se změnou a zároveň povšené ování objeků v ěo sluí je aoiké..druý případ, kdy se analyik přiklání k meaniké akualizai, je * Termín povšený zarnuje do analýzy všeny objeky sluku, j. ouliery i objeky uvniř sluku.

4 v případe, kdy jsou idenifikovány objeky se změnou, ovšem jeji poče vzledem k elku objeků není významný (zn. není rozpoznán sav změny) a zároveň povšené ování objeků v omo sluku je enropiké. Podmínkou pro volbu meaniké akualizae je konsaování o ování objeků: je enropiké (aoiké). Zde přiází na řadu dynamiký poled na segmenai. Jelikož podmínky prosředí se mění a ování objeků (klienů na finanční rzí) je převážně dynamiké, je řeba provádě jeji analýzu v průběu času. Foografie savu objeků v jednom okamžiku přináší do informaí o ování objeků náodnou složku. Ať slouží jako názorný příklad ransake klienů v bane: jisý klien provádí každý měsí v průměru 0 bankovní ransakí. Přijde měsí, ve kerém esuje do zaraničí a v zemi své rezidene nemá akivní ování; nevykazuje žádnou ransaki. V omo případě by bylo nesprávné vzí eno nulový údaj jako údaj jedné proměnné pro akualizai segmenae, jelikož ování kliena v om okamžiku bylo výjimečné a nepodobá se jeo ypikému ování. Pro definování ování objeků, sabiliy jeji poybu a směru, je řeba provádě sledování po rajekorií po jisá období, kerá voří ykly. Jeden yklus vyjadřuje čas, po kerý je zkoumána dynamika objeků. Na jeo koni je provedena příslušná akualizae vzorů ování. Maemaiký zápis pro yklus je C je o CT C, kde {,..., C} l. Cyklus je složen z období: C = { k k kon} { / l { kon } CC C /,..., C = a elek yklů { { }} l,..., ; pro období l yklu /. Celek období je zapisován =. Dynamikou segmenai je možné provozova pro jakýkoliv poče yklů, kerý je dán konkréním případem a podmínkami zpraování. Sejně ak délka období je dána odvěvím, keré je analyzováno a dispozií a ypem da, keré definují jednolivé proměnné. Přijaelné období z lediska pořízení da a možný změn ve věšině finančně zaměřený firem je jeden měsí. V seki 7, aplikae na daa simulovaná a skuečná, je sledován poyb objeků měsíčně a rimesrálně vyodnoován. První yklus C je vořen obdobím po, ož je sav před jakoukoliv modifikaí a je ukončen obdobím 3, ož je poslední období prvnío yklu (*). * + V prvním yklu je po =. V další ykle je = sluků. po kon. kon je období 3 po akualizai

4 Je nuné definova neenropiký poyb. Definie neenropikéo poybu (*), Χ i S, j S { }, kde CT / l {,..., kon} = a l > kon je definován poyb (**) : Poznámka: ij ij l+ l a) Χ Χ > 0 jako sabilní poziivní, ij ij l+ l b) Χ Χ < 0 jako sabilní negaivní, ij ij l+ l ) Χ Χ = 0 jako sabilní konsanní. kon kon + kon, jesliže, jesliže je poče uvažovaný období k definii neenropikéo ování; je definován následovně: kon je lié číslo, kon je sudé číslo. V prakikém užií je možné konsanní sav zařadi buď ke sabilnímu poziivnímu nebo sabilnímu negaivnímu poybu. Posuzovány jsou objeky známé i agregované, i Y. Definie je planá i pro ouliery. Je-li objek sabilní v poybu, bude označen Objek nesabilni v poybu ns X je objek s enropikým neboli aoikým poybem. Χ s X. Je aké vyvořena definie pro rajekorie poybu skupin objeků, jelikož sabilní objeky moou vykazova - ak jak je vyjádřeno šipkami v obrázku 6- III. (dvourozměrný prosor) - sabilní a) poziivní, sabilní b) negaivní, sabilní konsanní nebo kombinovaný ) a d) poziivní a negaivní poyb v elku proměnný a poybova se ak sie sabilně, ovšem všemi směry. * ** Neenropiký, zde i sabilní nebo endenční. V případě konsany je definován sav.

43 Jsou-li všeny objeky, zakreslené v obrázku 6- I., sabilní v poybu, pak pouým poledem na směry poybu objeků je možné konsaova, že objeky mají enropiký směr, jelikož se poybují všemi směry, aniž by exisovala skupinka objeků vykazujíí převažujíí směr poybu. V obrázku 6- II. jsou pozorovaelné dva objeky nesabilní v poybu (červené šipky). Dále je sledována skupinka objeků s převažujíím směrem poybu (černé šipky); exisuje jeden sabilní objek (modrá šipka), kerý se poybuje v jiném směru, než je rajekorie idenifikované věšinové skupinky objeků. Je pozorovaelný i jeden konsanní objek v jedné proměnné (žluá šipka). Obr 6- Enropie ování objeků I.) II.) III.) Směry poybu X i ) a) Výsledný směr poybu b) d) Definie neenropikéo směru (*) s S, Χ i S, j rajekorií { }, kde CT / l { kon} =,..., a l U, jejíž prvky jsou vyjádřeny následovně: X i > kon je definována maie, je-li poyb sabilní poziivní, U i j = 0, je-li poyb sabilní konsanní,, je-li poyb sabilní negaivní. * Neenropiký, zde i sabilní nebo endenční.

44 Pro X je definován vekor s i U k jako rajekorie ypu k. Pod rajekorií se rozumí elek odno U ij v jednolivý období (rajekorie předsavují řádky v maii Dodaečně je definován elek rajekorií jako K { k / k je rajekorie} S, keré mají rajekorii ypu k, je vyjádřen jako =. Poče e, s, ; naví E max{ e } k s k S S k K s S U ). s X sluku = reprezenuje nejvěší poče s X sluku S se sejnou rajekorií; jeji rajekorie (a aké rajekorie sluku S ) je označena sejné rajekorii mají neenropiký směr. U S. Skupinky objeků majíí sabilní poyb a poybujíí se po Definie 3: Akualizae klasifikaí do říd. Meaniká akualizae sluků je aplikována v případe, kdy analýza ování objeků ve sluí prokáže povšenou enropii poybu a/nebo směru objeků a zároveň buď nejsou idenifikovány objeky se změnou nebo není rozpoznán sav změny. Je vyvořena následujíí podmínka: Podmínka 3: definie kriéria ranie nesabiliy objeků s S, Χ i S plaí: s ES Podmínka 3 : β, kde 0 < β <. N S Koefiien β přísluší ranii sabiliy objeků. Aby byla splněna definie sabilnío ování, objeky sluku se musí poybova sabilně, ne aoiky. Nezávisí na velikosi poybu, edy vzdálenosi od savu v předešlém období, ale na endeni poybu. Vykazuje-li objek konsaní sav nebo poyb majíí buď sálou poziivní a nebo sálou negaivní endeni a o ve víe než v například 50% sanovenéo poču poslední navazujíí období yklu, pak je splněna první čás definie a zároveň je definován sabilní, neenropiký poyb objeků. Například, jsou-li objeky sledovány v průběu jednoo yklu, kerý je vořen řemi obdobími, proměnnými

45 ransake a saldo úču, pak v případě, že klien po všena období zvyšuje (snižuje) své ransake a snižuje (zvyšuje) své saldo nebo vykazuje konsanní sav, je splněna definie sabilnío poybu. Poyb může bý jak sejno ak proisměrný. Definií sabilnío směru jsou idenifikovány skupinky objeků sabilní v poybu poybujíí se sejným směrem (*). Neexisuje-li žádná skupinka, kerá by vlasnila objeky sabilní v poybu poybujíí se v jednolivý proměnný (poyb může bý jak poziivní, negaivní ak kombinovaný) v kon sejným směrem, jejíž velikos by byla > β * N S, pak je splněna podmínka rozodujíí o meaniké akualizai. V seki 7. bude mí koefiien β odnou 50%. Objeky, keré byly agregovány v období l+, kdy l+ > l, jsou sledovány pouze po dobu zbývajíí období yklu. Akualně agregované objeky, keré není možné sledova ve víe než v 50% období yklu, jsou definovány z defeku jako nesabilní, jelikož není jak prokáza sabiliu jeji poybu v poslední kon období. Dynamikou formou je v posledním období akuálnío yklu posupováno od posouzení definie sabilnío poybu a směru až k vyjádření podmínky 3 éo eapy. Realizae éo volby spočívá v klasifikai každéo akualizovanéo či agregovanéo objeku do sluku, pro nějž obdrží nejnižší koefiien příslušnosi (vzdálenos), bez zařazení informae spojené se změnami do formáů ování současný sluků: { d(, s )} s = argmin Χ. S Důvodem pro oo rozodnuí je konsaování, že aoiké ování ve smyslu poybu a směru není příčinou změny formáů ování a z oo vyplývajíí následný proesů, jako je například markeingová kampaň. * V jedné nebo ve víe proměnný sledovaný zvlášť nebo zároveň; definie závisí na analyikovi a konkréním případu.

46 Je-li splněna podmínka 3, je aplikována meaniká akualizae. V jiném případě přiází v úvau další možnos akualizae sluků, kerá již předpokládá změnu formáů ování současný sluků. Předpoklad, že akualizované objeky mají bý ineligenně akualizovány ve známé srukuře říd bez změny jeji poču, je možné realizova prosřednivím meody jako je například a, kerá je popsána v následujíí seki 6.3.. Vsupy pro seke 6.3. a 6.3. jsou vořeny příslušnosí objeků ke slukům včeně odno jeji proměnný v každém období yklu pro všeny sluky, jimž nebyly idenifikovány objeky se změnou nebo kerým nebyl rozpoznán sav změny. Meodou pro realizai definie neenropikéo poybu a směru je prosá regisrae sabiliy po rajekorií pro každý objek a jeo proměnné v každém deerminovaném období. Klasifikaí objeků v rámi aplikae meaniké akualizae byl zvolen i jeden ze ří sénářů změn, keré moou nasa ve vzore ování. To však nebrání v rozodnuí o relizai sénáře změny Zrušení sluků, jelikož eno sénář se nevylučuje s rozodnuím o aplikai někeréo ze zbývajíí dvou sénářů změny. Proo sluky, pro keré bylo rozodnuo o akualizai formou meaniké akualizae, posupují sekvenčně do eapy IV., Zrušení sluků. 6.3. Definie akualizae poybem říd Je analyzován problém akualizae sluků, keré buď nevlasní ouliery nebo u kerý nebyl rozpoznán sav změny a zároveň obě uvedené siuae se arakerizují podmínkou povšenéo sabilnío ování objeků ve sluí z lediska poybu i směru. V omo případě jsou objeky ve savu možnosi vnés změny do srukury říd. Tyo změny moou bý s ineligení zařazeny do vzorů ování ím způsobem, že zároveň využijí známou srukuru říd v kombinai s informaí, kerou vlasní a přinášejí akualizované a agregované objeky. Popsaný způsob změny vzorů ování je nazýván ineligenní akualizae. Dle následujíí definie jsou akualizovány y objeky, keré splnily opačnou podmínku ze seke 6.3..

47 Definie 4: Akualizae poybem říd. Ineligenní akualizae je aplikována na případy, kdy analýza ování objeků sluku neprokáže povšenou enropii ve smyslu směru a poybu objeků a zároveň buď nejsou idenifikovány objeky se změnou nebo není rozpoznán sav změny. Podmínka 4: definie kriéria ranie sabiliy objeků s S, Χ i S plaí: s ES Podmínka 4 : > β, kde 0 < β <. N S V seki 7. je volena ranie 50 % pro koefiien ranie sabiliy objeků z oo důvodu, že 50% sabilní objeků je považováno za kriérium dosaečně silné, aby molo byl mluveno o poybu sluků a na druou sranu dosaečně volné, aby molo bý s objeky v segmene zaázeno jako s prosředkem meody předpovědi ování sluků do budounosi; není řeba čeka na zvýšení ranie sabiliy, nýbrž je řeba včas organizova a realizova konkurenční proesy na podpoření či posavení se endenčnímu ování objeků. Volba koefiienu β však obeně závisí na konkréně řešeném příkladu. Předpoklad slukovaío algorimu je, že sředy říd reprezenují jeji omogeniu [] a proo se v popsané siuai nabízí s agregovanými a akualizovanými objeky realizova akualizai sředů sluků. Ineligenní akualizae sředů říd pro případ k-means je realizována následujíím způsobem: nejprve se všeny objeky klasifikují do příslušný sluků. Poé jsou přepočíány sředy sluků - jako nejvodnější akualizae, spočívajíí v poybu říd, je a, kerá má nejmenší sumu čverů yb vzdálenosí mezi objeky a sředy sluků. Výpoče souřadni sředu suku je prováděn meodou nejmenší čverů (MNČ). Formální zápis MNČ pro segmenai operujíí na základě Eukleidovy vzdálenosi je následujíí: ( d(, )) N min Χ i s. i=

48 Teno výpoče je proveden pro každý sluk a sanoven pro elek sluků, pro keré je řešením poyb říd (*). Sejně ak jako po realizai meaniké akualizae i zde je nuné následně projí eapou IV a analyzova možný zánik sluků. V éo víli zbývá analyzova případ, kdy doází k rozpoznání savu změny (je prokázána exisene dosaečnéo poču eerogenní objeků - seke 6.. a 6..). Poom zbývá rozodnou, zda sluky po rozpoznání savu změny se budou poybova nebo je řeba někeré sluky rozděli a vyvoři ak řídy nové. Při nerozpoznání savu změny a splnění podmínky z definie 4 se auomaiky akualizuje ineligenní formou. V úvodu seke 6.3 bylo uvedeno, že je-li ování významnéo poču objeků eerogenní bez prokázání evidenní endene v ování povšenéo poču sabilní objeků ve sluí s ouliery, je řeba yo objeky odděli a vyjádři ak rozdílnos jeji ování a o porušením akuální říd a vyvořením nový. Rozpoznání savu změny auomaiky neznamená, že by bylo nuné zvýši poče říd, jelikož en akuální poče může dobře reprezenova novou informai. V závislosi na rozodnuí uživaele, analyika a aplikai může bý volba vorby nový sluků dle definie kriérií narazena jinou možnosí, kerá by předpokládala, že jednu z možnosí akualizae říd v případě rozpoznání savu změny voří akualizae poybem říd, kerá byla popsána v seki 6.3.. Je proo řeba posoupi do seke 6.3.3 na definie akualizaí a kriérií rozodování. 6.3.3 Definie akualizae vorbou nový sluků V případe, kdy nebyl rozpoznán sav změny, byly ouliery vyodnoovány společně se zbývajíími objeky sluku. Analýza éo eapy se bude ováním oulierů zabýva podrobněji. * V omo případě pořadí objeků v souboru da může ovlivni výsledné odnoy sředů sluků nerozodne-li se pro akualizai až po dokončení zařazení vše objeků.

49 Jelikož se předpokládá, že obená meodologie dynamiké segmenae by měla na základě ování objeků předvída akualizae a sav segmenů do budounosi, je výodné praova s ouliery za jisý podmínek ne jako s objeky eerogenními (v důsledku jeji vzdálenosi ke sředu sluku), nýbrž jako s objeky, keré svým ováním vyjadřují budouí ování segmenu (a objeků v něm). V éo eapě bude rozodováno, zda se sluky s významným počem eerogenní objeků budou děli mezi nové řídy (pro zajišění omogeniy ování objeků uvniř sluků) nebo bude aplikována možnos ineligenní akualizae. V případě vorby nový říd je akualizae realizována vyvářením nový říd a přirazováním příslušnosi každéo objeku ke svému sluku. Je řeba vyřeši problém opimálnío poču říd a zařazení objeků do ni. Opimalní poče říd je až do současnosi émaem výzkumu. Aplikae, keré jsou na eno problém připraveny, vlasní kriéria na výběr opimálnío poču říd (meoda k-means eno algorimus nevlasní). Kromě zvolené eniky na sanovení opimálnío poču sluků se na omo rozodnuí významnou měrou podílí analyik a uživael. Je řeba aké sanovi maximální možný poče sluků, ož opě závisí na konkréním markeingovém případu. Je řeba zdůrazni, že úkolem éo práe není sanovi eniky opimální poče sluků. Poče sluků je sledován spíše z prakikéo lediska, jelikož uživael není ooen zrai poeniální, nově se objevujíí elky objeků. Bude-li v seki 7 rozodnuo pro sénář Tvorby nový říd, sluk bude rozdělen do poču říd pouze o jeden supeň vyšší a zároveň bude sanoven maximální poče sluků: 0. Třída bude vyvořena v případě, bude-li vlasni přinejmenším 3% známý objeků sledovaný na počáku akuálnío yklu. Siuae, ve kerý byl rozpoznán sav změny a keré jsou v omo duu analyzovány, mají jako vsupy sluky s rozpoznaným savem změny, konkréně všeny informae, keré pomoou vyodnoi sanovené podmínky a na omo základě rozodnou, dojde-li k vorbě nový říd nebo bude zvolena akualizae ineligenní. Meodou a kriérii jsou opě sledování poybu objeků ve smyslu sabiliy po rajekorií, nyní však vyodnoeny způsobem příslušným éo eapě, kerý je následujíí: sluk může vlasni ouliery poybujíí se různým směrem. Jesliže sluk vlasní několik skupinek sabilně se

50 poybujíí oulierů po různý rajekorií a alespoň jedna ze skupinek oulierů arakerizujíí se svou rajekorií sabilně se poybujíí objeků reprezenuje víe než například 80% vše oulierů sluku, pak je aplikováno podobné kriérium jako v seki 6.3. a sledováno, zda víe než 50% vše objeků (včeně oulierů) se poybuje v om samém směru jako nejvěší skupinka oulierů (majíí víe než 80% vše oulierů). V případě splnění popsaný podmínek je rozodnuo ve prospě poybu segmenu. Hranie 80% je volena vysoká z oo důvodu, že poyb segmenu s významným počem eerogenní objeků bez vyvoření nový říd může nasa jen v případě evidennío sabilnío poybu věšiny objeků (jak oulierů ak objeků uvniř řídy) po rajekorii. V případě, kdy ouliery nevoří počenou skupinku víe než 80% sabilní a sejnosměrný oulierů sluku nebo yo nejsou podpořeny sabilním sejnosměrným (majíí sejnou rajekorii jako nejvěší skupinka sabilní sejnosměrný oulierů) poybem víe než 50% objeků segmenu, je rozodnuo pro vyvoření nový říd. Objeky, keré se poybují v jiném směru než je poyb sluků nebo jsou příliš vzdálené nově vyvořeným řídám jsou po definii a realizai akualizae vše sluků vyodnoovány jako případné skuečné (*) ouliery. Aby segmen nebyl příliš rozšířen, jsou yo klasifikovány do segmenu, k jeož sředu mají po provedení vše akualizaí nejblíž a o aniž by ovlivnily formáy ování ěo segmenů. (*) Poznámka: Jedním z problémů meod, založený na minimalizai rozpylu (k-means), je efek, kerý mají aypiké objeky na výpoče sumy čverů yb. V seki 6.3 je možné praova s ouliery v jeji pravém slova smyslu, edy sledova, keré objeky definované ze seke 6. jako ouliery jsou skuečnými ouliery (objeky s exrémními odnoami vzdálenosí) a pro výpoče MNČ je možné je z analýzy vylouči. Je proo nuné zrevidova daa, analyzova každý oulier a rozodnou o jeo osudu. V dvourozměrném prosoru je možné ouliery deekova například z grafu disperse. Další možnosí je vyvoři graf boxplo, je-li úkolem idenifikova vzdálená pozorování pro jisé prioriní proměnné. Pomoí isogramu je možné považova 5% nejnižší a nejvyšší odno jako ouliery. V mnoorozměrném prosoru je možné uží Maalanobisovu vzdálenos, kerá je mírou vzdálenosi každéo objeku k průměru vše pozorování. Vysoká odnoa ooo ukazaele idenifikuje objek, kerý má exrémní odnoy v jedné nebo ve víe proměnný.

5 Definie rajekorií oulierů a objeků (sabilní v poybu) ve sluí s rozpoznaným savem změny: poču Ať o U S je rajekorie Χ sluku o, s o e S oulierů sluku S ) s rajekorií S se sejnou rajekorií jako je rajekorie S a s o E, S je nejvěší skupina o U S. Je definováno, že E,, o znamená o s S s es S U = Χ (z elkovéo o, s s e S je poče o U S. s Χ sluku Definie 5: Akualizae vorbou nový říd. Sluky ve savu změny jsou rozděleny mezi věší poče říd v případě, kdy poyb věšiny objeků v segmenu je enropiký a/nebo není směrově ideniký poybu oulierů, keré jsou vořeny skupinkou významnéo poču sabilní oulierů majíí idenikou rajekorii. Podmínka 5a: definie kriéria ranie sabiliy oulierů S, o, s i S Χ plaí: Podmínka 5a : E e o, s S o S γ, kde 0 < γ <. Koefiien γ přísluší ranii sabiliy oulierů. nebo Podmínka 5b: definie kriéria ranie vorby novéo sluku s o, s S, Χ, Χ S plaí: Podmínka 5b : E s, o S N + e S s S δ, kde 0 < δ <. Koefiien δ přísluší ranii vorby nový sluků. Je-li splněna podmínka 5a nebo 5b definie 5 - evenuelně moou bý splněny obě podmínky současně - je zvýšen poče říd. Meodou vorby nový sředů říd, edy nový vzorů ování, je opě MNČ, kerá byla popsána v seki 6.3.; v aplikai k-means je definován deerminovaný poče říd a meodou minimální sumy čverů yb je sanoveno opimální rozložení sředů sluků.

5 V jiném případě, při splnění obou opačný podmínek z éo eapy, je uován poče říd a meodou MNČ doází k poybu sředů sluků a k rozpýlení objeků do sluku, k jeož sředu mají nejmenší vzdálenos. Důvodem pro úvau možnosi poybu segmenu v případě exisene eerogenní objeků je následujíí ypoéza: jesliže se poybuje věšina objeků sabilně a určiým směrem a někeré (významný poče) z ěo objeků jsou eerogenní ěm původním, pak je velmi pravděpodobné, že v příší eapě se budou další objeky posunova ímo směrem. Úmyslem je nejen mapova současnou siuai, ale aké předvída budouí ování a oo ování podpoři či naopak mu zabráni a využí ak konkurenční výody obodu. Tak se vyvářejí speifiké kampaně, definované na základě arakerisik objeků reprezenovaný sředem sluku. Sanovení nižšío poču říd - ve smyslu sloučení říd - než je en současný, již není obsaem éo práe (nebyl definován akový sénář změny). Dle logiky problému by se jednalo o zkoumání možnéo sloučení omogenní objeků. Ke sloučení říd může dojí, ovšem ao siuae se projeví jako klasifikae objeků do již exisujíí říd a zánik é řídy, kerá nebude splňova definie ranie minimálnío možnéo poču objeků a ranie času pozorování, definované v eapě IV. Sloučení říd a například aké možnos překročení sanovenéo poču sluků je émaem budouío výzkumu. Po průodu prvními řemi eapami obené meodologie a po akualizai vzorů ování užiím jedné ze dvou možnosí navržený sénářů změn jsou znovu posouzeny všeny objeky ve smyslu jeji vzdálenosi ke všem nově vyvořeným formáům ování. Může oiž nasa siuae, že někeré objeky budou paři do někeréo ze zbývajíí segmenů z důvodu menší vzdálenosi k jeo sředu, jelikož došlo ke změně vzorů ování. Je proo znovu počíána vzdálenos každéo objeku ke sředům nově akualizovaný sluků; k přesunu objeků doází na základě porovnání vzdálenosi ke každému ze sředů sluků. Po sanovení jedné ze dvou forem akualizae sluku je řeba, na kompleai možnosí sénářů změn, auomaiky přejí do eapy IV.

53 6.4 Eapa IV: Zánik sluků Vždy exisuje informae, kerá po uplynuí jiséo časovéo období již není relevanní; další formou, jak políže na eno jev, je připusi možnou změnu ve vzore ování, jelikož přesávají exisova y současné. To přísluší v dynamiké slukové analýze sénáři Zrušení říd, keré nemají dosaečný poče objeků na o, aby byly považovány za podklad pro následné kampaně (jsou o nově vzniklé řídy s malým počem objeků nebo řídy, u niž byl redukován poče objeků; může nasa i siuae, že objeky jednoduše v příším yklu přesanou exisova, například při úmrí nebo změně bydlišě klienů v bane) a naví po několik sekvenční yklů (období) jim nebyl agregován akový poče objeků, aby jeji poče spolu se známými objeky byl dosačujíí. V éo eapě obené meodologie je řeba vyřeši několik problémů najednou; jsou o oázky: kdy zruši řídu - s čímž souvisí definie pojmu ranie času pozorování a ranie minimálnío možnéo poču objeků - a jak zaáze, v případě že exisuje, se zbykovou informaí. Je řeba definova ranii minimálnío možnéo poču objeků, pod kerou již poče známý a agregovaný objeků není dosaečný na přežií segmenu ve smyslu jeo prakikéo využií. Hranie času pozorování spočívá v poču období, kdy není pozorována agregae objeků známý ani nový ve řídá s nedosaečným počem objeků. Období a poče objeků jsou spojeny s každým individuálním problémem a aplikaí. Too období je definováno jako C max, ož je maximální poče yklů (období), po keré řída s nedosaečným počem objeků udržuje paměť, zaímo jí není přiřazen objek. Minimální možný poče objeků je jisá ranie, kerou je možné arakerizova určiým proenem z elkovéo poču objeků; je definována koefiienem ω pojmenovaným ranie minimálnío možnéo poču objeků. Na základě popsanéo je řeba vyvoři a udržova jednoduou paměť. Tao paměť má zaova informai po určený poče yklů (období) a naví regisrova pro řídu s menším než minimálním možným počem objeků poče známý (akualizovaný) a agregovaný objeků běem každéo určenéo yklu (období). Na zformalizování právě popsanéo bude ao jednoduá paměť označena paměť regisru a je definována formou

54 maie P (S x ), kerá regisruje exiseni objeků { } i Χ řídy Je zapsána odnoa, jesliže byly agregovány objeky do řídy počem objeků; v opačném případě je zaznamenána odnoa 0. S v každém období yklu. S s nedosaečným Srnuí defini pro řídu, kerá bude sledována ve smyslu její možnéo zániku, je následujíí: Definie 6: Zánik sluků Ke zrušení sluku doází v případě, kdy sluk neobsauje dosaečné množsví objeků a po jisá časová období (ykly) nepřijímá žádný objek, ak jako je sanoveno podmínkou 6: Podmínka 6a: definie ranie minimálnío možnéo poču objeků, Χ i S plaí: S es Podmínka 6a : < ω, kde 0 < ω <. N Koefiien ω je ranie minimálnío možnéo poču objeků. Podmínka 6b: definie ranie času pozorování Χ S jesliže je splněno: d ( Χ, s ) < d( Χ, s ), S, Χ i S. a Dodaečně se požaduje, že je-li i S Χ v kon, pak: Podmínka 6b : Χ v až S C Cmax. i + Hranii času pozorování a minimální poče objeků sanoví analyik s uživaelem. Měla by bý sodná s deerminaí poču yklů, po keré je sledován dynamiký poyb objeků před rozodnuím o jeji akualizai. V případě, že poče objeků není dosaečný a nebyly agregovány nové ani známé objeky po určená časová období, sluk je zrušen a objeky moou bý vyloučeny nebo sloučeny s již exisujíími sluky. V éo prái se analyik přiklání k jeji klasifikai do

55 nejbližšío segmenu a v případě, voří-li skuečné ouliery, nebudou ovlivňova vzory ování. Vsupy do éo eapy jsou vořeny počy objeků v každé řídě. Meodou je vyvoření paměi regisru, kerá sleduje poče objeků známý i agregovaný po jisá časová období pro určené segmeny (s nedosaečným počem objeků). Zvolenou akualizaí sluků jsou eliminovány ouliery, kerými byly před akualizaí označeny objeky vzdálené slukům. Objeky, keré by - po průodu čyřmi eapami obené meodologie a po posouzení aplikae vše deerminovaný sénárů změn - vořily skuečné ouliery, je možné z analýzy buď eliminova nebo je zařadi do nejbližšío segmenu, aniž by ovlivnily výpoče nový formáů ování (molo by oiž dojí k umělému rozšíření sluků). Poé je opakovaně provedena konrola, zda-li všeny objeky přísluší do sluků, od jeož sředu mají nejmenší vzdálenos. V případě, že s oledem na vzdálenos objeků ke sředům sluků již nedoází k dalšímu přesunu objeků mezi sluky, nevyváří se reálné ouliery a neobjeví se sluk, kerý by měl nedosaečný poče objeků, je možné eno sav považova za ukončení yklu. Tím je aké ukončena akualizae vzorů ování realizovaná výběrem navržený sénářů změny. 6.5 Eapa V: Idenifikae rajekorií K implemenai obené meodologie je přidán problém idenifikae srukury říd před a po jeji akualizai. Vždy, kdy se provádí akualizae, je získána příslušnos každéo objeku k jednomu z exisujíí sluků v následujíím yklu. Spojením současný sluků, definovaný svými formáy ování (ať již akualizovanými nebo zaovanými z minuléo yklu), s ěmi, keré exisovaly v předázejíím období, je vyvořena spojnie mezi sředy sluků pojmenovaná rajekorie vzorů ování mezi ykly; je o spojnie vekoru sředů sluků. Maemaiky zapsáno, T je maie S x C, kde každá řádka reprezenuje souřadnie sředu

56 každéo sluku v čase, o znamená v posledním období každéo yklu. T S přísluší vekoru, kerý obsauje rajekorie sluku S v čase, edy souřadnie svéo sředu v čase. Je připomenuo usanovení, že segmen může bý ideniký omu z předešléo období; další možnosí je poyb sředů sluků, vyvoření nový sluků nebo zánik někeréo ze sluků. Uživael by měl mí jasný záměr sraegie ve smyslu akualizae formáů ování sluků reprezenovaný svými vzory ování. Jinými slovy - exisují segmeny, keré je řeba podporova a doplňova dalšími objeky a na druou sranu segmeny, keré obsaují objeky, keré jsou obeně řečeno nerenabilní. Exisují markeingové kampaně, keré mají za úkol pobíze přesun objeků ve smyslu požadovanéo směru poybu. Vývojové endene, keré jsou předsavovány právě popsanými rajekoriemi, konsruují podkladové údaje, na kerý se zakládají markeingové sraegie. Teno způsob analýzy sledování objeků po rajekorií v průběu časový yklů je významný aké z oo důvodu, že dovoluje poopi budouí změny a endene v příslušném prosředí.

57 7 APLIKACE OBECNÉ METODOLOGIE PRO PŘÍPAD S IDENTIFIKÁTOREM ALGORITMEM K- MEANS 7. Aplikae na daa simulovaná Daa použiá v následujíí aplikai jsou simulována a zpraována v souladu s následujíí dynamikou: výozí sav v prvním období prvnío yklu C je vořen čyřmi řídami, kde se akualizují a agregují objeky po dva navazujíí ykly (každý yklus je složen ze ří období: první, meziobdobí a řeí 3 ) do maximálně šesi sluků způsobem, že v prvním yklu jsou dva sluky rozděleny mezi nové řídy, jeden je akualizován poybem a do jednoo jsou pouze klasifikovány objeky. Na koni druéo yklu exisuje řída, kerá neobsauje žádný objek a řída, kerá má jen jeden nový objek; žádnému ze sluků nejsou obnoveny vzory ování. Vekory proměnný (dále jen proměnné), keré definují sluky, jsou dva: X a X. Analýza objeků ve smyslu jeji dynamiky je sledována mezi proměnný zároveň. a 3 v obou dvou Vyvořená obená meodologie je aplikována pro každý sluk zvlášť na koni každéo yklu, kdy je analyzován sav a ování objeků a v rámi sénářů změn vybírány formy akualizae formáů ování sluků. Sálá kriéria, aplikovaná běem dvou analyzovaný yklů, jsou následujíí (*) : Výozí sav říd: {,,3, 4}. V eapě I, Idenifikae objeků, keré předsavují změnu, jsou yo v segmenu vzdálenosi následovně: Χ o X, jesliže S idenifikovány výpočem a porovnáním Eukleidovy kon po po max s d( Χ, s ) > d (plaí i pro Y ). i * Přeled symbolů, defini a paramerů a aké sourn eap s podmínkami a jeji kriérii je uveden v příloá. a.3.

58 V eapě II, Rozpoznání savu změny, je eno v segmenu S rozpoznán, jesliže e > 0. N. o S S V eapě III., Rozodnuí o možnose akualizae sluků, je provedena akualizae klasifikaí do sluků S, jesliže E.5 ( N ). s S 0 S V případě opačném, kdy E > ), doází k akualizai poybem sluků. s S 0.5 ( N S Kriéria jsou sanovena zároveň pro obě dvě proměnné zn., že obě proměnné se podílejí na konsruki rajekorie poybu ( E je kombinaí sabilní objeků majíí s S ideniký směr poybu v obou proměnný). Tyo akualizae jsou provedeny pro siuae, kdy není rozpoznán sav změny. Při rozpoznání savu změny, kdy E 0. 8 e o, s S o S nebo E o, s S + e 0. 5 N doází k vyvoření nový říd. V případě splnění obou dvou opačný kriérií je aplikována akualizae poybem sluků. Akualizae sředů říd při změně formáů ování se provádí MNČ. V eapě IV, Zrušení sluků, doází k eliminai sluku, jesliže S < 0.03 N a zároveň pro eno sluk e s S S, a i S Χ v kon plaí: Χ S v C až C (plaí pro každé období yklu). i + + V eapě V, Idenifikae rajekorií, jsou yo vyjádřeny spojnií T S, kerá přísluší vekoru obsaujíímu rajekorie sluku S v čase, edy souřadnie svéo sředu mezi ykly. Po průodu prvními řemi eapami je pro každý sluk vybrána příslušná možnos akualizae sluků definovaná v eapě III., ovšem až po čvré eapě je ukončen yklus idenifikae možný sénářů změn. Poslední, páá eapa, srnuje konečné arakerisiky sluků při ukončení každéo časovéo yklu a promíá sav vývoje dynamiké segmenae, ož umožňuje sledova konkréní savy sluků a jeji variae po reálný rajekorií svý sředů v čase. V následujíí čási je předveden posup aplikae obené meodologie dynamiké segmenae. Grafy a abulky reprezenují mezivýsledky a savy rozodování v jednolivý

59 eapá. Na koni každéo yklu je prezenován graf vývoje dynamiké segmenae a srnuy arakerisiky jednolivý sluků. Poznámka: V seki 7 a 8 v někerý abulká, ale i v někerý obrází a grafe, nebylo možné nasavi volbu jazyka a orografii češiny ani používa symboliku definovanou v seki 6 (eno problém se ýká oupuů insalae SPSS). 7.. Cyklus první 0) Počáeční poče říd v : S = 4 Tenikou segmenae ve dvou fází je vybrán jako opimální výozí sav sluků poče 4. Proměnné jsou v prvním období pojmenovány X a X. Poče původní objeků je 00 (soubor vše objeků s jeji idenifikáorem, kerý slouží aké jako pořadové číslo v souboru da, s příslušnosí ke svému sluku v sluku je uveden v příloze.4, sloupe, a 3). V prvním yklu je ykle je = + po kon. kon je období 3 po akualizai vzorů ování. a se vzdálenosí ke po =. V další V následujíí ře abulká 7-, 7- a 7-3 jsou srnuy někeré arakerisiky původní říd: jeji sředy, poče objeků spadajíí do každéo sluku a vzdálenosi sředů sluků od sebe navzájem. Celá siuae je definována pro sav (první období prvnío yklu), edy sav před jakoukoliv akualizaí či agregaí objeků. Graf 7- znázorňuje všeny objeky období slukům, keré jsou reprezenovány sředy. a barevně vyjadřuje přislušnos objeků ke svým Tab 7- Sředy sluků v Tab 7- Poče objeků ve sluí v Proměnné X. X. Sředy sluků s s s3 s4 0 30 3 5 30 55 7 Sluky S S S3 S4 N 5 9 55 Celkem 00

60 Tab 7-3 Vzdálenosi sředů sluků navzájem v Reueno Vzdalenosi Vzdálenosi mezi sredy sředy sluku sluků S S S3 S4 S S 0 3,0 0 S3 3, 48, 0 S4 9,6 50,6 6,4 0 Nejvzdálenější jsou si sluky S a S 4 a nejblíže k sobě mají y nejpočenější segmeny, kerými jsou S a S 4. Graf 7- Disribue objeků v mezi sluky v (*) Poznámka: Bodem je označen objek, křížem sřed sluku. Ve vše grafe seke 7. je planá následujíí symbolika: bodem je označen objek, křížem sřed sluku, čísla vyjadřují idenifikáor a aké pořadí objeků v arívu da (pro unifikai objeků a lepší orienai), čverečky vyjadřují ouliery, čverečky s ečkou skuečné ouliery, objeky vyjádřené fialovym písmem jsou agregované objeky. Pro vyjádření disribue objeků uvniř každéo sluku z poledu jeji vzdálenosi ke sředu sluku slouží abulka 7-4 a graf 7-. * Objeky v znamená objeky sledované v prvním období prvnío yklu. Sluky v znamená sluky vyvořené v prvním období prvnío yklu. Všeny názvy grafů a abulek v seki 7 sledují právě popsanou logiku.

6 Tab 7-4 Vzdálenos objeků v ke sředu příslušnéo sluku v Sluky S S S3 S4 Průměr Min Max N 8,3,6 4,6 5 3,7,8 4,7 8,8 3,6 4, 9 6,8, 3, 55 Dle arakerisik sluků, pozorovaný v abule 7-4, je možné vyslovi jisé ypoézy. Sluky s nejvěší průměrnou (a maximální) vzdálenosí objeků od sředu sluku, keré mají naví relaivně malý poče objeků, jsou sluky široké (rozpýlené), neomogenní v objeke a udíž nesabilní. Hypoézou o jeji ování v budouí období je jeji rozdělení mezi víe říd; v analyzovaném případě oo plaí pro sluk, dále pak sluk 3. Naopak, sluky s malou průměrnou (a maximální) vzdálenosí a s velkým počem objeků jsou sluky úzké, omogenní a sabilní. Hypoézou o jeji budouím ování je poyb nebo klasifikae objeků. Těmio arakerisikami disponují především sluk 4, dále pak i sluk. O zrušení sluků zaím není možné vyslovi žádnou ypoézu, jelikož obená meodologie posupuje sekvenčně přes eapu III., kde jsou vybrány možnosi akualizae a eprve poé je posoupeno do eapy IV., kerá na základě akualizovanéo savu sluků přeází k odnoení možnosi zrušení sluků. Graf 7- Rozložení objeků v uvniř sluků v

6 Pro sledování reálný oulierů je vybrána enika, kerou reprezenuje graf ypu boxplo, ve kerém není sledován žádný skuečný oulier definovaný sluků. Sav objeků v období 3 je možné pozorova v grafu 7-3. Jsou přidány nové objeky; poče objeků je nyní 05. Všeny objeky si s sebou přinášejí svou barvu z grafu v období z důvodu lepší orienae při sledování jeji přemísění a příslušnosi ke sluku. Červené jsou objeky, keré pařily v období do sluku, žlué do sluku, zelené do sluku 3 a modré do sluku 4. Vzory ování zůsávají zaím beze změny, sodné jsou udíž i sředy sluku, opě vyjádřené křížem. Graf 7-3 Disribue objeků v 3 mezi sluky v Již pouým poledem na graf je možné dedukova, že došlo k výraznému poybu objeků mezi sluky. Jsou vidě i evidenní ouliery, jako je například objek číslo, 00 nebo 6. Zaím však ješě není známo, keré objeky budou paři do jakéo segmenu a udíž keréo sluku budou zmíněné objeky ouliery. Proměnné mají v omo období, keré je posledním obdobím prvnío yklu, odnoy 3 3 X a X.

63 ) Eapa I.: Idenifikae objeků, keré předsavují změnu Dynamika eapy: Aby byly objeky zařazeny do svý příslušný říd, jsou Eukleidovou věou počíány vzdálenosi každéo objeku od sředu každéo sluku a objeky jsou zařazeny do oo sluku, ke kerému mají nejmenší vzdálenos (odnoy proměnný a 3, Eukleidovy vzdálenosi objeků 3 k příslušnému sluku v klasifikován každý objek v 3, jsou v příloze.4, sloupe 4 ). l X a l X v, a sluk, do keréo je 3 Poé jsou pro každý sluk sledovány ouliery: vzdálenos d ( Χ, s ) každéo objeku v 3 (plaí aké pro 3 Y ) od svéo příslušnéo sluku v je srovnávána se vzdálenosí max s d. Objeky, keré přesaují uo vzdálenos, jsou označeny jako ouliery (příloa.4, sloupe, oulier označen číslem ). v období Následuje abulkovou a grafikou formou sourn elkovéo savu pro všeny sluky a 3 : poče objeků v každé řídě a jeji přesun mezi řídami (abulka 7-5), průměrné, nejvěší a nejmenší vzdálenosi objeků v 3 od sředů sluků definovaný v (abulka 7-6). Siuai doplňuje graf 7-4, kerý zobrazuje aké reálné ouliery. Na závěr je ukázán sav rozodování v éo eapě (abulka 7-7). Tab 7-5 Poče a přemísění objeků mezi sluky mezi a 3 Sluky v 3 S S S3 S4 N Sluky v S S S3 S4 S0 N 7 3 4 5 30 4 0 9 4 3 3 3 0 3 6 34 0 53 5 9 55 5 05 Poznámka: S 0 je řída pro agregované objeky vložené do analýzy v období po Analýzou grafu 7-3 bylo sledováno významné přemísění objeků mezi sluky. V abule 7-5 je kromě proséo savu objeků v a. 3 možné eno poyb deailně sledova. Celkový poče objeků v každém jednolivém sluku se příliš nezměnil: nejpočenější je S 4, nejmenší S a S 3. Z S bylo víe než /3 objeků přesunuo do jiný

64 říd, především do nejbližšío S 4. Nejvíe objeků získal S přesunem aké právě z ooo sluku. Z poué výměny objeků mezi S a osaními sluky a bez deailní analýzy dynamiky objeků v každém období zaím není možné sledova endeni objeků a udíž ani eléo S. Teno sluk vlasní všeny nové, agregované objeky, keré by moly bý objeky eerogenními, jelikož byly klasifikovány do S z důvodu nejmenší vzdálenosi od jeo sředu a by ovšem mola bý významná. S a S 3 aké regisrují nepravidelné přemísění objeků mezi osaními sluky. Tyo mají naví malý poče objeků, z čeož je možné dedukova budouí vorbu nový říd. V S 4 servala věšina známý objeků. K podsané výměně mezi ímo nejvěším slukem došlo s S a vzledem k relaivnímu poču objeků aké s S (směr poybu objeků z S do S 4 je v obou proměnný negaivní). Tab 7-6 Vzdálenos objeků v 3 ke sředu příslušnéo sluku v Sluky S S S3 S4 Průměr Min Max N,3,5 4, 30 9,0 0,8 60,9 9 0,7,3 5, 3 6,8,0 3,8 53 Hypoézy o ypu akualizae sluků, získané v průběu analýzy z abulek 7-4 a 7-5, podporuje abulka 7-6: pro S je o poyb objeků nebo jeji klasifikae, pro S a S 3 vyvoření nový říd a pro S 4 nejpravděpodobněji klasifikae objeků. Prosým zařazením objeků do sluku se zvyšuje průměrná vzdálenos mezi objeky a sředy sluků; segmen se rozšiřuje. Rozšíření sluku po prosé klasifikai objeků bez akualizae vzorů ování povrzuje graf 7-4. V grafu 7-4a) je možné sledova reálné ouliery sluku (objeky 8, a 3) a (objek ), posuzované dle vzdálenosi objeků ke sředu sluku, vyodnoené pro obě dvě proměnné. Je-li odnoena proměnná zvlášť (7-4b), jsou nalezeny reálné ouliery pro segmen a 4. Při sledování proměnné (7-4) jsou idenifikovány reálné ouliery v segmenu a 3. X 3 X 3

65 Graf 7-4 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v a) pro obě proměnné b) pro 3 X ) pro X 3 Každý sluk bude mí oulier, jelikož všeny maximální vzdálenosi pro všeny sluky jsou v omo období vyšší než v období (abulka 7-6). Akualizae arakerisik sluků poslouží k úpravě sluků ak, aby exisoval nízký poče říd a zároveň žádný objek nebyl příliš vzdálený ypikému objeku sluku, kerý je jeo sředem.

66 Všeny sluky, jelikož vlasní objeky předsavujíí změnu, by moly bý kandidáy na vyvoření nové řídy (abulka 7-7). Tab 7-7 Sav rozodování v první eapě C Sluky S S S3 S4 Celkem N Exisene oulieru Sav rozodování 30 ANO M,I,NT 9 ANO M,I,NT 3 ANO M,I,NT 53 ANO M,I,NT 05 Poznámka: V elé seki 7. je označena symbolem M meaniká akualizae, symbolem I ineligenní akualizae a symbolem NT nové řídy. ) Eapa II.: Rozpoznání savu změny Dynamika eapy: Jsou sledovány všeny sluky, kerým byly v předozí eapě idenifikovány objeky ve savu změny. Vsupními day jsou poče známý i agregovaný objeků a zvlášť oulierů s příslušnosí ke svému segmenu. Aby bylo rozodnuo ve prospě savu změny, musí bý poče oulierů v příslušném sluku v 3 věší než 0, * N S. Grafy 7-5 a 7-6 zobrazují klasifikované známé a agregované objeky v 3 do svý sluků v ; zvlášť jsou znázorněny ouliery idenifikované obenou meodologií. Graf 7-5 Objeky v 3 klasifikované do sluků v

67 Graf 7-6 Disribue oulierů mezi zbývajíími objeky v 3 a) ve sluí a 3 b) ve sluí a 4 Poznámka: v grafe jsou znázorněny ouliery definované dle obené meodologie i ouliery skuečné dle analýzy grafu boplo v obou proměnný zároveň i v proměnný analyzovaný zvlášť. Je-li objek idenifikován jako reálný oulier (může bý zároveň i oulier dle obené meodologie), je označen čverečkem s ečkou. v Po porovnávání vzdálenosi vše objeků v 3 ke sředu svý příslušný sluků s nejvěšími původními vzdálenosmi objeků od sředů sluků v exisuje elkem 7 oulierů v elkovém poču N objeků v 3 (abulka 7-8 ). bylo zjišěno, že Siuae rozodování v průběu obené meodologie, konkréně na koni drué eapy, je následujíí (abulka 7-8): Tab 7-8 Sav rozodování ve drué eapě C Sluky S S S3 S4 Celkem Objeky uvniř sluků N % N N Ouliery % N Celkem 4 80,0% 6 0,0% 30 M, I 4 44,4% 5 55,6% 9 NT 8 6,5% 5 38,5% 3 NT 5 98,%,9% 53 M, I 88 88,3% 7 6,% 05 N Sav rozodování

68 Rozodování o vyvoření nové řídy se zúžilo na druý a řeí sluk. Pro první a čvrý připadají v úvau (z důvodu nevýznamnéo poču oulierů) meaniká nebo ineligenní akualizae vzorů ování. 3) Eapa III.: Rozodnuí o možnose akualizae sluků Dynamika eapy: Ve řeí eapě je rozodnuo ve prospě meaniké akualizae klasifikaí do říd, jesliže analýza ování objeků ve sluku prokáže (alespoň pro jednu proměnnou) povšenou enropii směru a/nebo poybu, zn. poče vše objeků sluku (včeně oulierů) se sabilním poybem a směrem pro obě proměnné současně je menší nebo roven koefiienu ranie sabiliy objeků násobeným počem známý objeků; koefiien ranie sabiliy objeků je v omo případě 0,5. Ineligenní akualizae je aplikována na případy, kdy analýza povšenéo ování objeků sluku pro obě dvě proměnné zároveň neprokáže enropii, edy poče objeků se sabilním poybem a sejnou rajekorií je věší než 50% známý objeků a zároveň buď nejsou idenifikovány objeky se změnou nebo není rozpoznán sav změny, ož plaí i pro rozodnuí ve prospě možnosi meaniké akualizae. Akualizae poybem říd se provádí v souladu s MNČ. Poyb objeků je sabilní, i když je proisměrný v obou proměnný. Sabilní konsanu je možné dle předozío usanovení přiřadi k objekům buď s poziivním nebo s negaivním sabilním poybem. Agregované objeky, voříí ouliery, budou v ěo podmínká (ře období voříí yklus) vždy nesabilní, jelikož neexisuje dosaečný poče období na povrzení sabiliy poybu. Kriériem na sanovení vorby nový říd je směr a sabilia poybu objeků a oulierů. Sluky ve savu změny jsou rozděleny mezi věší poče říd v případě, kdy neexisuje skupinka sabilní oulierů věší než 80% (ož je ranie sabiliy oulierů) vše oulierů s idenikou rajekorií nebo v případě, kdy rajekorie věšiny objeků (včeně oulierů) se sabilním poybem (koefiien ranie vorby nový sluků je 0,5) není ideniká rajekorii oulierů, keré mají sabilní poyb a voří skupinku > 80% vše oulierů oo saméo sluku. Nasává vorba nový říd, kdy se poče sluků zvyšuje o jeden supeň, v analyzovaném případě do maximálně desei říd.

69 V případě splnění obou dvou opačný kriérií jsou sluky ve savu změny akualizovány ineligenní akualizaí. Akualizae vzorů ování se provádí akéž MNČ. Pro řídu a 4 dle savu rozodování z předozí eapy případá v úvau klasifikae či poyb říd. Je edy vyodnoována sabilia objeků ěo sluků a o prosým sledováním a součem objeků, keré prokazují sabiliu jak poybu, ak i směru. Kriéria poybu a směru jsou posuzována pro obě dvě proměnné zároveň. Pro sluky a 3 je řeba naví sledova poče a ování oulierů a srovnáva o s povšeným ováním sluku. Poče objeků sabilní v poybu je elkem 38, z oo řída jedna ji vlasní 7, řída dva 4, řída ři 7 a řída čyři 0 (abulka 7-9). Proměnné, keré zaznamenávají sabiliu, jsou uvedeny v příloze.4, sloupe 3 6; sabilia je označena číslem -, 0 nebo. Tab 7-9 Sabilia poybu objeků ve sluí v C Sluky S S S3 S4 Celkem Sabilia poybu objeků nesabilní sabilní N 3 7 30 5 4 9 6 7 3 43 0 53 67 38 05 Povšenou sabiliu objeků je možné sledova v abule 7-0, kerá zpřeledňuje všeny sluky, ovšem slouží především pro y, kerým nebyl rozpoznán sav změny či nebyly idenifikovány objeky se změnou ěmi jsou řídy a 4. Tab 7-0 Sabilia poybu a směru objeků v proměnný X a X v C Sabilia objeků X. + Y. 99-0 X. + Y. X. + Y. S S S3 S4 S S S3 S4 99 99 99 99 - - - 3 5 6 43 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 8 0 0 0 0 0 0 0 Poznámka: 99 značí nesabilní poyb, značí poyb sabilní poziivní, - sabilní negaivní a 0 sabilní konsanu. Sejná symbolika plaí pro elou seki 7..

70 X. Například, sluk má řie objeků, z oo 7 sabilní. objeky mají poziivní endeni u obou proměnný, objeků poziivní u proměnné X a negaivní u proměnné X, objeky sabilní konsanu X a poziivní X ad. Celkově 5 objeků v proměnné X rose, klesají dva objeky. U proměnné X objeků vykazuje pokles, růs a 3 konsanní sabilní sav. Deailní poled na jednolivé sluky A) Sluk Při sledování sabiliy poybu a směru vše objeků segmenu ve vše ře období je z abulek 7-9 a 7-0 vidě, že sluk má 3 nesabilní a 7 sabilní objeků v poybu. Z ěo 7 objeků je poyb objeků u proměnné X poziivní a zároveň u proměnné X negaivní. Konečný směr poybu objeků a edy jako rajekorie sluku bude definován en směr, kerým se poybuje věšina sabilní objeků. objeků + konsany ze 30 objeků ve sluku voří 43% z elkovéo poču objeků ooo sluku. Jelikož však nové objeky nemoou vykazova sabiliu, nejsou proo zarnuy do vyčíslení kriéria podmínky éo eapy. + objeky se sabilním směrným poybem voří 5% objeků sluku, kde poče objeků bez ě nový je 5. Při omo způsobu vyčíslení kriéria na rozodnuí o klasifikai objeků či poybu segmenu je poče sabilní objeků s jisou rajekorií věší než 50% vše známý objeků a proo je rozodnuo pro poyb ooo sluku, realizovanéo pomoí MNČ. 7-7. Pro přeled sabiliy poybů a rajekorií objeků sluku jsou yo znázorněny v grafu Graf 7-7 Trajekorie sluku v průběu C a) objeky s enropií ování b) objeky bez enropie ování 0 5 99 3 4 5 9 6 60 90 0 0 03 04 05 X. 7 8 9 4 5 7 8 3 56 8 Směr poybu Smery Směry poybu X. X. Poznámka: Šipky vyznačují povšené směry poybu. V legendě jsou objeky označeny číslem idenifikáoru. Ta samá symbolika plaí i pro osaní grafy ooo ypu v seki 7..

7 Graf 7-7a) vyjadřuje enropii ování objeků (v poybu nebo směru). Naproi omu graf 7-7b) zobrazuje objeky, keré mají nejenom sabilní poyb, ale i sejnou rajekorii poybu. objeků je sabilní v poybu i směru a objeky jsou sabilní konsany (konsany v jedné proměnné; ve drué mají endeni poybu i sabilní objeků). B) Sluk 4 Sluk 4 obsauje 0 sabilní objeků v poybu z elkový 53 objeků, ož již bez další analýzy rajekorie směru objeků značí, že dojde k prosé klasifikai objeků do říd. Pro ilusrai je předveden poyb a směr sabilní objeků ooo segmenu v grafu 7-8. Graf 7-8 Poyb objeků sabilní v poybu a jeji rajekorie ve sluku 4 v průběu C 39 77 84 78 95 35 98 6 88 68 X. Směr poybu X. Jak již bylo napsáno v úvodu éo eapy, pro sluky a 3 je řeba provés lubší analýzu, kerá se ýká srovnávání ování sabilní oulierů s povšeným ováním objeků ěo sluků (abulka 7-). Tab 7- Sabilia poybu a směru vše objeků a zvlášť oulierů v proměnný X a X v C ve sluí a 3 Sluky X. objeky uvniř 99 sluku 3 ouliery objeky uvniř sluku ouliery 99-99 - 99 - X. 99-3 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 0 0

7 C) Sluk Druý sluk obsauje 4 sabilní objeky, z niž 3 jsou ouliery. Celkový poče objeků v segmenu je 9 (graf 7-9). Neexisuje skupinka sabilní směrný oulierů věší než 80% vše oulierů oo sluku, jelikož dva z ěo oulierů (67%) se poybují jiným směrem než řeí oulier. Již z éo skuečnosi je možné vyvodi rozodnuí o akualizai sluku, jímž bude rozdělení sluku mezi dvě nové řídy. Naví, uvniř sluku exisuje jen jeden sabilní objek, zn. že ani v případě sejnosměrnéo poybu vše sabilní objeků sluku by nebylo doíleno ranie 50% sabilní sejnosměrný objeků a udíž by nebylo rozodnuo ve prospě drué alernaivy rozodování, kerou je poyb sluku. Graf 7-9 Poyb a rajekorie objeků sluku v průběu C X. 6 6 00 3 4 48 55 65 Smery Směry poybu Poznámka: žluou barvou jsou znázorněny objeky sabilní v poybu - šipky ukazují jeji rajekorie. X. D) Sluk 3 Sluk číslo 3 obsauje elkem 3 objeků, z ni 4 jsou ouliery sabilní v poybu: a se poybují rozdílným směrem (poziivní, negaivní). Není řeba provádě lubší analýzu objeků uvniř segmenu, jelikož neexisuje věšinová skupinka oulierů segmenu majíí sabilní směrný poyb. I kdyby analyik pokračoval v analýze, zjisil by, že ani uvniř segmenu neexisuje významný poče objeků poybujíí se po sejné rajekorii sabilním poybem (graf 7-0). Je přijaa volba vorby nový říd meodou nejmenší čverů.

73 Graf 7-0 Poyb a rajekorie objeků sluku 3 v průběu C Xi, X. 0 8 64 67 9 93 94 30 74 86 87 89 9 Smery Směry poybu Poznámka: žluou barvou jsou znázorněny objeky sabilní v poybu - šipky ukazuji jeji směr. Xi, X. Sav rozodování na koni éo eapy je zpřeledněn v abule 7-. Tab 7- Sav rozodování ve řeí eapě C Sluky S S S3 S4 N poče známý objeků poče vše objeků s o s E S E, s o s E S ( N ) E, S s, o s s, o s E o S + e S S e E S S + e S S N N sabilní sabilní N S 5 30 7 3 5% 0 0 I 9 9 3 67% % NT 3 3 4 50% 5% NT 53 53 0 9 7% 0 0 M 00 05 všeny objeky sluku Nejveší skupina sabilní objeků s rajekorií k: (%) ouliery nejvěší skupinka sabilní oulierů s rajekorií k: (%) všeny objeky sluku nejveší skupinka sabilní objeků s rajekorií k: (%) Sav rozodování Nyní je realizována akualizae vzorů ování sluků dle abulky 7- a o ze čyř současný do šesi navržený meodou nejmenší čverů (graf 7-).

74 Graf 7- Akualizae vzorů ování v C a) S b) S ) S 3 d) S 4 Sluk je ineligenně akualizován. Sluk je rozdělen mezi dva sluky, keré budou označeny S a S 3. Sluk 3 je rozdělen mezi sluky S 4 a S 5 a sluk S 4, akualizovaný klasifikaí objeků, je přejmenován na S 6. Nyní jsou znovu posouzeny všeny objeky ve smyslu jeji vzdálenosi ke všem nově vyvořeným formáům ování. Tako je 7 objeků přesunuo z jedné řídy do jiné, k jejímuž sředu mají blíž (abulka 7-4, graf 7-) Poé jsou opě MNČ sanoveny sředy sluků. Opakovaným výpočem vzdálenosi každéo objeku ke každému ze sluků je povrzeno jeji zařazení do příslušnéo sluku, ak jako arakerisiky vzorů ování

75 sluků na koni řeí eapy (příloa.4: příslušnos objeků do akualizovaný sluků, vzdálenos objeků k akualizovaným slukům, přesunované objeky - ve sloupi je uvedn sluk přesunu, oprava příslušnosi objeků k akualizovaným slukům a opravená vzdálenos ke sředům sluků jsou uvedeny ve sloupí 7 - ). Následujíí ři abulky (7-3, 7-4, 7-5) srnují savy před a po akualizai, přesuny objeků až k vyjádření konečnéo savu po vše opravá příslušnosí objeků ke slukům. Tab 7-3 Reueno sluky po akualizai v _kon N Poče objeků ve sluí před a po akualizai v S S S3 S4 S5 S6 objeky v 3 klasifikovane klasifikované do sluku sluků vyvoreny vyvořený v 0 S S S3 S4 3 a kon N 30 0 0 0 30 0 3 0 0 3 0 6 0 0 6 0 0 3 0 3 0 0 0 0 0 0 0 0 53 53 30 9 3 53 05 Tab 7-4 Poče a umísění opravený objeků ve sluí po jeji akualizai v Reueno přesun objeků ze sluku N S S3 S6 přesun objeků do sluku S4 S5 S6 N 0 0 0 0 0 4 0 4 4 7 kon Tab 7-5 Konečný poče objeků ve sluí po opravá jeji zařazení v Reueno sluky po akualizai a po presunu přesunu opraveny opravený objeku objeků N S S S3 S4 S5 S6 objeky v 3 klasifikovane klasifikované do sluku sluků vyvoreny vyvořený v 0 S S S3 S4 N 8 0 0 0 8 0 3 0 0 3 0 5 0 0 5 0 3 0 4 0 0 0 4 4 0 0 49 5 30 9 3 53 05 kon

76 Graf 7- Oprava po akualizai a finální zařazení objeků do akualizovaný sluků v kon Poznámka: Objeky označené kolečky s křížky jsou objeky, keré se přesunují mezi sluky (oprava po akualizai). Barva kolečka vyjadřuje novou řídu příslušnosi. Zvolenými akualizaemi jsou sníženy vzdálenosi objeků ke sředům příslušný sluků (srovna abulky 7-6 a 7-9) a jsou eliminovány ouliery, kerými byly před akualizaí označeny objeky vzdálené slukům. Objeky, keré by nyní vořily skuečné ouliery (graf 7-3), je možné z analýzy buď eliminova nebo je zařadi do nejbližšío segmenu, aniž by ovlivnily výpoče nový formáů ování (vyvářely by nereálné sředy sluků).

77 Graf 7-3 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v kon a) pro obě proměnné b) pro kon X ) pro X kon Jak ukazují grafy boxplo, jsou-li sledovány obě proměnné najednou, nejsou idenifikovány reálné ouliery (na rozdíl v období 3 před akualizaí vzorů ování). Proo žádný objek nebude eliminován a všeny budou zařazeny do vorby nový vzorů ování.

78 4) Eapa IV.: Zánik sluků K zániku sluku doází v případě, vlasní-li eno méně objeků, než je definovaná ranie minimálnío možnéo poču objeků, zde 3% ze známý objeků vše sluků; naví, běem dvou následujíí navazujíí yklů (a vše jeo období) nepřijímá žádný agregovaný ani žádný ze známý objeků. Jelikož je proázeno prvním yklem, nejsou zaím sledovány žádné sluky, keré by měly nedosaečný poče objeků. Ani v éo fázi není akový sluk deekován, jelikož minimální poče objeků ve sluku jsou 3, ož voří 3% ze známý objeků a eno poče nesplňuje podmínku definujíí zánik sluků. V případě, že s oledem na vzdálenos objeků ke sředům sluků již nedoází k dalšímu přesunu objeků mezi sluky, je eno sav považován za ukončení prvnío yklu akualizae vzorů ování. Touo eapou je aké ukončen yklus výběru možný sénářů změn. 5) Eapa V.: Idenifikae rajekorií Pro idenifikai rajekorií, edy směru poybu segmenů, je řeba spoji jeji sředy na počáku a na koni realizovanéo yklu (sav na koni jednoo yklu je i počáečním savem následujíío yklu). Z grafu 7-4 je vidě, jak jsou sluky akualizovány. Graf 7-4 Reálné rajekorie poybu sluků mezi po a kon Poznámka: Malým křížkem jsou označeny původní sluky z (neboli z po ). Sřed sluku 4 v po po se překrývá se sředem sluku 6 v kon.. Velkými kříži jsou označeny sluky kon

79 V abulká 7-6, 7-7, 7-8 a 7-9 jsou srnuy arakerisiky akualizovaný říd na koni prvnío yklu: jeji sředy, poče objeků spadajíí do každéo sluku, vzdálenosi sředů sluků od sebe navzájem a vzdálenosi objeků od sředu svý sluků. Teno sav je výozím savem pro druý yklus ( po ). Reueno Tab 7-6 Sředy sluků v Sředy sluků kon ( po ) Proměnné X. X. s s s3 s4 s5 s6 5 0 0 38 4 5 36 97 57 4 Tab 7-7 Poče objeků ve sluí v kon ( po ) Sluky S S S3 S4 S5 S6 Celkem N 8 3 5 4 4 5 05 Tab 7-8 Vzdálenosi sředů sluků navzájem v kon ( po ) Vzdálenosi mezi sředy sluků S S S3 S4 S5 S6 S S S3 S4 S5 S6,0 6,,0 5,8 4,,0 36, 8,0 40,,0 37, 94,0 53,,0,0 5,0 86, 48,4 34,5 0,,0 Tab 7-9 Vzdálenos objeků v 3 ke sředu příslušnéo sluku v kon ( po ) Sluky S S S3 S4 S5 S6 Průměr Min Max N 8,5,0 7,3 8 3,0 5,4 7,7 3 6,0 7,8,5 5 0, 3, 8,0 4 7, 3,6,5 4 6,6,0 3,0 5

80 7.. Cyklus druý 0) Počáeční poče říd v : S = 6 po Ve druém yklu se vyází ze segmenae vyvořené v yklu prvním; sourn arakerisik původní říd v omo období je ideniký ěm, keré jsou uvedeny v abulká v konovém období prvnío yklu. Poče sluků je zvýšen o dva. Sluky, keré nebyly rozděleny mezi nové řídy (nyní a 6) mají éměř sejný poče objeků jako na počáku prvnío yklu; došlo k přemísění někerý objeků. Nejvzdálenější sluk všem osaním je sluk. Nejpočenější sluk 6 je slukem nejvyrovnanějším, má nejmenší průměrnou vzdálenos objeků ke svému sředu. Naopak, segmenem s nejvěším rozpylem objeků je sluk 3. Malými sluky o do poču objeků jsou sluky, 3 a 4, keré by moly bý adepy na zrušení sluků. Původní rozložení objeků ve sluí na počáku zobrazeno v grafu 7-5 a). po je Proměnné v prvním období jsou pojmenovány X a je 05. X. Poče původní objeků Sav objeků ve řeím období C je ukázán v grafu 7-5b). Je možné předpokláda, že řída 3 bude zrušena (oranžové objeky) a objeky klasifikovány do sluku. Sejně ak v případě řídy 4 v grafu je možné pozorova pouze jeden - svěle zelený - objek, ož znamená, že zbylé objeky řídy 4 přesaly exisova. Třída udržuje relaivně sejné rozložení objeků, sejně ak řídy 5 a 6. Objek, označený vínovou barvou, je novým objekem přidaným v omo yklu do analýzy. Pařil by zřejmě do bývalé řídy 4; proože je však v éo řídě objekem osamoeným, mol by bý buď eliminován nebo klasifikován do nejbližší řídy. Obeně je možné říi, že objeky nejpočenější sluků zůsaly éměř beze změny příslušnosi říd.

8 Graf 7-5 Disribue mezi sluky v po objeků a) v po b) v 3 ) Eapa I.: Idenifikae objeků, keré předsavují změnu Dynamika eapy: Objeky jsou nejprve klasifikovány do svý příslušný říd, ak jak je vidě v abule 7-0, grafu 7-7 a v příloze.4 (odnoy proměnný X l a l X v, a 3 druéo yklu, vypočená Eukleidova vzdálenos a příslušnos ke svému sluku v v 3 jsou ve sloupí - 9). pro objeky Tab 7-0 Reueno Sluky v 3 N S S S4 S5 S6 Poče a přemísění objeků mezi sluky mezi Sluky v _po S0 S S S3 S4 S5 S6 po a N 0 7 0 5 0 35 0 0 3 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 8 9 0 0 0 0 3 4 45 8 3 5 4 5 03 3

8 Třída 3 neobsauje žádný objek, řída 4 obsauje jeden a o agregovaný objek. Poče objeků na počáku yklu je 05. V průběu yklu je do sluku 4 zařazen jeden nový objek (v ), ovšem již v přesávají exisova ři objeky oo saméo sluku. Ze řídy 3 jsou všeny objeky přesunuy do řídy a ak v Poče objeků v 3 je 03. 3 nevlasní žádný objek. Dle kriéria ranie eerogeniy jsou sledovány ouliery; porovnáním maximální vzdálenosí z abulek 7- a 7-9 není prokázána exisene oulierů s výjimkou sluku. Naví, věšina průměrný vzdálenosí je ve srovnání s konem minuléo yklu redukována. To znamená, že objeky a ím i sluky se v omo yklu zkonsolidovaly snižuje se poče sluků a objeky jsou blíže ypikým objekům sluků. Tab 7- Vzdálenos objeků v 3 ke sředu příslušnéo sluku v po Sluky S S S4 S5 S6 Průměr Min Max N 7,7,0 7,8 35,5 6,7 5,7 3,4,4,4 6,8,4,4 9 7,,4,0 45 V grafu 7-6 je možné sledova reálné ouliery. Jediný sluk, kerý by mol bý kandidáem na vyvoření nový říd, je sluk. Tabulka 7- zobrazuje výsledný sav rozodovaní pro první eapu.

83 Graf 7-6 Rozložení objeků v 3 a znázornění reálný oulierů uvniř sluků v kon a) pro obě proměnné b) pro kon sluky v 3 X ) pro X kon Tab 7- Sav rozodování v první eapě C Sluky S S S4 S5 S6 Celkem N Exisene oulieru Sav rozodování 35 ANO M,I,NT 3 NE M,I NE M,I 9 NE M,I 45 NE M,I 03

84 ) Eapa II.: Rozpoznání savu změny Dynamika eapy: Jelikož je nalezen pouze jeden oulier a o v prvním sluku (příloa.4, sloupe 30), (graf 7-7), kerý má 35 objeků, není rozpoznán sav změny. Graf 7-7 Ouliery v 3 mezi klasifikovanými objeky do sluků v po To znamená, že všeny sluky budou akualizovány pouze meanikou nebo ineligenní akualizaí, jak ukazuje abulka 7-3. Tab 7-3 Sav rozodování ve drué eapě C Sluky S S S4 S5 S6 Celkem Objeky uvnir sluku Ouliery Celkem Sav rozodovani N % N N % N N 34 97,%,9% 35 M M, I 3 00,0% 0 0.0% 3 M 00,0% 0 0.0% MM, I 9 00,0% 0 0.0% 9 MM, I 45 00,0% 0 0.0% 45 M 0 99,0%,0% 03 M, I

85 3) Eapa III.: Rozodnuí o možnose akualizae sluku Dynamika eapy: V omo yklu je možné pozorova pouze 7 objeků sabilní v poybu. Ve sluku jedna exisuje jeden akový objek ak jako ve sluku pě. Sluk šes ji má 5, zbývajíí sluky žádné (abulky 7-4 a 7-5). Tab 7-4 Sabilia poybu objeků ve sluí v C Sluky S S S4 S5 S6 Celkem Sabilia poybu objeků nesabilní sabilní N 34 35 3 0 3 0 8 9 40 5 45 96 7 03 Tab 7-5 Sabilia poybu a směru objeků v proměnný X a X v C X. + Y. X. + Y. S S S4 S5 S6 S S5 S6 Sabilia objeků 99 99 99 99 99 0 0 0 X. + Y. 99-0 34 3 8 40 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 V omo yklu žádný ze segmenů nemá víe než 50% objeků sabilní v poybu, proo by ani nebylo nuné sledova jeji směr na vyslovení závěru, že všeny řídy budou akualizovány meanikou akualizaí (abulka 7-6).

86 Tab 7-6 Sav rozodování ve řeí eapě C poče známý objeků poče vše objeků všeny objeky sluku nejvěšíi skupinka vše sabilní objeků v poybu s rajekorií k: (%) Sav rozodování Sluky S S S4 S5 S6 N N sabilní s E S 35 35,9% M 3 3 M 0 M 9 9 5,3% M 45 45 5 5,% M E s S ( N ) S Jelikož došlo pouze k meaniké akualizai a žádný segmen není zrušen, sav na koni C je opě 6 říd se sejnými vzory ování jako na koni C. Změnila se pouze disribue někerý objeků mezi sluky (graf 7-5 b, abulka 7-7 a příloa.4, sloupe 9 a 30). Tab 7-7 sluky po akualizai v _kon N S S S5 S6 Poče objeků ve sluí před a po akualizai v 3 a objeky v 3 3 klasifikované klasifikovane do do sluků sluku vyvořený vyvoreny v 0 v 0 kon S S S4 S5 S6 N 35 0 0 0 0 35 0 3 0 0 0 3 0 0 9 0 0 0 0 0 0 45 45 35 3 9 45 03 Poznámka: V abule je již vyjádřen přesun osamoenéo objeku sluku 4 do nejbližšío sluku - sluku 5, ve kerém figuruje eno objek jako oulier a není započíáván do arakerisik sluku 5. 4) Eapa IV.: Zánik sluků Tao analýza se ýká řídy 3, kerá nevlasní žádný objek a řídy 4 s jedním objekem. Objek ze segmenu 4 bude pro osaní sluky nejspíš oulierem, proo bude buď eliminován nebo zařazen do nejbližšío sluku, ovšem nebude mí vliv na změnu vzorů ování a ím ani na realizai následný proesů pos akualizae vzorů ování sluku.

87 Pro ujasnění ermínu paměť regisru a jejío operování je v abule 7-8 ukázáno, jak je do éo paměi zapisována informae o řídá, keré nevlasní dosaečný poče objeků. Třída 3 neměla ve druém yklu žádný objek (všeny její objeky byly klasifikovány do jinéo sluku). Je řeba sledova, zda po dva následujíí ykly eno sluk nepřijme žádný nový ani známý objek v omo případě by došlo na koni čvréo yklu k jeo zániku. Ovšem ve skuečnosi ve řeím yklu (kerý v seki 7. není analyzován) je do sluku 3 znovu zařazen jeden jeo bývalý objek (objek číslo 48). To znamená, že nyní sie vlasní menší poče objeků, než je definovaná ranie minimálnío možnéo poču objeků, ovšem yklus sledování paměi regisru je přerušen zařazením objeku 48 a je proo nuné opakova en samý proes a regisrova sejnou informai po další dva ykly. Ve sluku 4 přesávají ři objeky exisova, jeden objek se přesunuje do jiné řídy a jeden objek je agregován. Teno objek je v paměi regisru po dva následujíí ykly regisrován jako jediný; bude proo na koni čvréo yklu rozodnuo o zrušení čvréo sluku. Tab 7-8 Paměť regisru mezi ykly C až C 4 pro sluky 3 a 4 Sluk Objeky Idenifikáor 3 { X } i Exisene objeků mezi ykly C _kon C _kon C3 _kon C4 _kon 4 0 0 0 6 0 0 48 0 0 55 0 0 0 65 0 0 0 4 { Y } i { X } i { Y } i 0 0 0 0 30 0 0 0 3 0 0 0 0 0 0 0 8 0 06 0 Poznámka: Paměť regisruje objeky mezi ykly po jednolivý období. V abule 7-8 jsou však pro zjednodušení uvedeny informae po ykle. znamená exisene objeků, 0 znamená negae exisene. Neprovádí se opravy zařazení objeků, jelikož nejsou změněny vzory ování. Teno sav je považován za ukončení druéo yklu akualizae vzorů ování. Touo eapou je aké ukončen yklus výběru možný sénářů změn.

88 6) Eapa V.: Idenifikae rajekorií Objek s idenifikáorem 06, kerý by byl ve sluku 4 jediným objekem, je klasifikován do sluku 5, aby nedošlo k jeo eliminai. Neovlivňuje ovšem srukuru sluku 5, proo průměrná i maximální vzdálenos sluku 5 pro další yklus bude planá a, kerá byla získána v období se neruší. To samé plaí pro sluk 3. 3. Sluk 4 jako akový je však sále v planosi, v omo yklu Reálné rajekorie akualizovaný sluků jsou zobrazeny v grafu 7-8. Graf 7-8 Reálné rajekorie poybu sluků mezi po a kon Poznámka: Sředy sluků v kon jsou ideniké sředům sluků z kon. Jelikož nejsou akualizovány vzory ování mezi prvním a druým yklem, sředy sluků zůsávají ideniké ěm na počáku C. Carakerisiky vše sluků na koni druéo yklu jsou srnuy v abulká 7-9, 7-30, 7-3 a 7-3 (sředy sluků, poče objeků spadajíí do každéo sluku, vzdálenosi sředů sluků od sebe navzájem a vzdálenosi objeků od sředu svý sluků). Teno sav je výozím savem pro řeí yklus ( 3 po ).

89 Reueno Tab 7-9 Sředy sluků v kon ( 3 po ) Promenne Proměnné X. X. Sredy Sředy sluků sluku s s s3 s4 s5 s6 5 0 0 38 4 5 36 97 57 4 Tab 7-30 Poče objeků ve sluí v kon ( 3 po ) Sluky S S S3 S4 S5 S6 Celkem N 35 3 0 0 0 45 03 Tab 7-3 Vzdálenosi sředů sluků navzájem v kon ( 3 po ) Vzdálenosi mezi sředy sluků S S S3 S4 S5 S6 S S S3 S4 S5 S6 0 6, 0 5,8 4, 0 36, 8,0 40, 0 37, 94,0 53,,0 0 5,0 86, 48,4 34,5 0, 0 Průměrná vzdálenos objeků od sředů sluků v kon se oproi 3 nemění. Tab 7-3 Vzdálenosi objeků v 3 ke sředu příslušnéo sluku v kon ( 3 po ) Sluky S S S3 S4 S5 S6 Průměr Min Max N 7,7,0 7,8 35,5 6,7 5,7 3 - - - 0,4,4,4 0 6,8,4,4 0 7,,4,0 45

90 Na uzavření seke aplikae obené meodologie pro případ s idenifikáorem algorimem k-means na dae simulovaný je v abule 7-33 srnu sav nejdůležiější arakerisik první dvou eap sledovaný sluků dvou analyzovaný yklů a v grafu 7-9 je sledován poyb objeků, vývoj sředů sluků mezi obdobími C a C a zobrazeny reálné rajekorie poybu sluků. C C C C C C N N N N N Tab 7-33 Carakerisiky sluků v průběu aplikae obené meodologie v C a C l po 3 kon 3 kon S N N souřadnie S 5 0 30 8,3 4,6 S 30 55 3,7 4,7 3,0 S3 9 3 7 8,8 4, 3, 48, S4 55 5 6,8 3, 9,6 50,6 6,4 00 S 5 5,3 4, ineligenní S 9 0 9,0 60,9 nové řídy S3 3 0 0,7 5, nové řídy S4 53 0 6,8 3,8 meaniká 00 5 S 8 5 36 8,5 7,3 S 3 0 97 3,0 7,7 6, S3 5 0 57 6,0,5 5,8 4, S4 4 38 0, 8,0 36, 8,0 40, S5 4 4 4 7,,5 37, 94,0 53,,0 S6 5 5 6,6 3,0 5,0 86, 48,4 34,5 0, 05 S 35 0 7,7 7,8 meaniká S 3 0,5 5,7 meaniká S3 0 0 S4 0,4,4 meaniká S5 9 0 6,8,4 meaniká S6 45 0 7,7 4,0 meaniká 0 S 35 5 36 7,7 7,8 S 3 0 97,5 5,7 6, S3 0 0 57 5,8 4, S4 0 38,4,4 36, 8,0 40, S5 0 4 4 6,8,4 37, 94,0 53,,0 S6 45 5 7,,0 5,0 86, 48,4 34,5 0, 03 N X X S d ( X ) d ( s, s i ), S m n průměr max S S S3 S4 S5 S 6 Typ akualizae

Graf 7-9 Přeled reálný rajekorií poybu sluků mezi po a kon 9

9 7. Aplikae na daa skuečná (*) 7.. Analyzovaný problém Bankovní oddělení Řízení korporaivní báze da má za úkol v rámi BIO S (Business Improvemen Opporuniies) zrenabilizova nový projek Daa Wareouse, kerým je právě probíajíí migrae da do nově zakoupenéo a implemenovanéo logikéo modelu da. S úmyslem vybra akový projek renabiliy, kerý by korespondoval s ročními íly korporae jsou nejprve zrevidovány sraegiké íle banky na rok 005. Cíle se ýkají několika okruů, kerými jsou: osoby a inovae, proesy, klieni a finane. Do finančnío okruu každoročně paří úkoly zvýšení zisku, zvýšení účasi na ru a zvýšení efekiviy. Plány, kerými jmenované bankovní oddělení může v rámi finanční záměrů přispě ke splnění někerý ílů roku 005 a zároveň se přímo podíle na renabiliě Daa Wareouse využíváním a analýzou jeo informaí, jsou zobrazeny v obrázku 7-. Obr 7- Cíle a někeré plány Bi na rok 005 Osoby a inovae Proesy Sraegiké íle banky 005 Klieni Finane Zvýši účas na ru Takiké íle Zvýši efekiviu Plány Zvýši renabiliu Zvýši renabiliu Sníži index ododu klienů z banky * Seke 7. je ve srovnání se sekí 7., kde byla s deaily vysvělena aplikae obené meodologie, méně podrobná. Cílem seke Aplikae na daa skuečná již není vysvěli aplikai a porozumě jí, nýbrž sledova její funkčnos na dae skuečný a ukáza ak její prakiké použií.

93 Konkréním úkolem, kerý je k řešení vybrán, je idenifikova poeniálně renabilní klieny s vyšší endení zavří svůj běžný úče (ož je vyjádřeno indexem ododu) a posléze v kooperai s oddělením markeingu zabráni ěmo klienům v ododu z banky. Klieni, na keré se analýza zaměří, budou mikropodnikaelé zemědělskéo sekoru (vinie, rybolov a mořské plody, ovonářsví, expor zemědělský produků a produke mléka). K řešení problému je vybrána meodologie práe BIO S (obr. 7-, paenovaná firmou NCR), kerá bude řídi proes plnění íle. Spočívá v sekvenčním průodu čyř eap: sanovení íle, analýza problému (definie oázek obodu a klíčový indikáorů, exrake da a aplikae daaminingový a saisiký enik na vyvinuí deskripivnío nebo predikivnío modelu), komerční ake a zodnoení výsledků sledováním meriký indexů. Meodologie, vyvinuá v éo prái, spadá do eapy analýzy problému, konkréně modelae problému deskripivními a predikivními enikami. Jsou definovány ři základní oázky obodu: Kdo je klienem s poeniální renabiliou? Keří klieni mají endeni v nejbližším období odejí z banky? Jaké je ování skupin klienů, segmenovaný dle odno poeniální renabiliy a indexu ododu? Obr 7- Séma meodologie práe BIO S Zdroj: NCR

94 Po vymodelování úloy a zodnoení ování klienů přijdou na řadu obodní ake, jako například: pro klieny, keří mají vysokou (vyšší) endeni odejí z banky a vysokou poeniální renabiliu (obrázek 7-3, sluk 3) bude vyvořen plán jeji zadržení a o nabídkou produku, kerý jim ybí, zlepšením kvaliy služeb či zrušením poplaků za jisé služby. Klienům se sředně vysokou poeniální renabiliou a sřední endení ododu (obrázek 7-3, sluk ) bude poslán dárek či zaelefonováno s blaopřáním k narozeninám. Pro klieny s nízkým koefiienem ododu a nízkou renabiliou (obrázek 7-3, sluk ) bude nabídnu jisý krediní produk s úmyslem je zrenabilizova. Pro klieny z poslednío kvadranu obr. 7-3 není v omo momeně připraven žádný program. Obr 7-3 Sloučení klienů do říd dle odno poeniální renabiliy a indexu ododu Poeniální renabilia 3 0.5 0.75 Index ododu K modelai navrovanéo problému je vybrána enika segmenae, konkréně algorimus obené meodologie, kerá je díky svým arakerisikám považována za nejvodnější ke splnění sanovenéo úkolu. Záměrem je oiž provádě konsanní pozorování poybu klienů a dle akuálnío savu a ování klienů v minulosi předpovědě jeji budouí vývoj. Užiím obené meodologie dynamiké segmenae ak bude možné vyvíje pos segmenační proesy manipulae s vybranými klieny dle jeji endenčnío ování v čase, zn. realizova komerční kampaně šié jim na míru v okamžiku, kdy je o nejvodnější se záměrem zabráni ododu klienů s poeniálem. Využiím dynamiké segmenae a její sopnosi předpovědě budouí endene není nuné čeka, až

95 se klien přesune z jednoo segmenu do jinéo a eprve poom vyvíje příslušné akiviy; s výodou před konkurení je možné využí příležiosi obodu a o regulaí zákazníkova poybu - pobízením přesunu do segmenu renabilnío s nízkým indexem ododu a naopak zabráni poybu do rizikovéo a nerenabilnío segmenu. O každém klienovi je k dispozii poled na jeo ování v průběu času a ak i na aplikované logiky navazujíí komerční kampaně, jelikož analýza v každém období je posavena na segmenai vyvořené v období předozím. Užií výsledků aplikae je široké, proo kromě lavnío íle je možné například i renabilizova někeré skupiny klienů. Popsaná sraegie zvýodní banku ve flexibilnějším, rylejším, ekonomiky a konkurenčně výodnějším rozodování. 7.. Daa Z poledu modeláora je v první řadě řeba analyzova vybraný problém z perspekivy disponibilní da. Sledováním odno proměnný jsou aké definovány koefiieny kriérií eap proesu obené meodologie. Daa přísluší informai.056 mikropodnikaelů zemědělskéo sekoru Bi se svým idenifikáorem a ru (*). Tao skupina je pořízena výběrem z elku klienů Bi Banka Mikropodnikaelé. Počáeční poče říd je volen enikou segmenae ve dvou fází. Je praováno pouze se dvěma proměnnými (**). Proměnná poeniální renabilia je však kombinaí čyř aribuů: segmen (vysoký, sřední, nízký), index maeřské banky (dlu uvniř banky/dlu ve finančním sysému), idex křížení produků a exisene služeb plaby závazků za dodavaeli. Vyvořením proměnné poeniální renabilia je zodpovězena první definovaná oázka obodu. Teniky použié na vyvoření popsané proměnné jsou analýza lavní komponen, soring a logi, kerý na základě údajů z minulosi předpoví pro jisé budouí období, bude-li klien v omo období renabilní či nikoliv. Tao kvaniaivní spojiá proměnná bude převedena do inervalu odno od 0 do (abulka 7-34). Vysvělením drué oázky obodu je proměnná endene ododu klienů z banky a ak jako první proměnná, poeniální renabilia, není pevným aribuem přímo získaným z báze da; je řeba jej předpovědě. K jeo předpovědi bude užia enika neuronové síě * ** Ru je idenifikační číslo každéo občana v Cile srovnaelné s OP Čeů. Bylo ověřeno, že pro víe aribuů operuje obená meodologie sejným způsobem.

96 kombinujíí proměnné demografikéo arakeru a bankovnío ování (proměnné zařazené do modelu, ariekůra síě, meoda učení, sop paramery a sav rainingu jsou uvedeny v příloze.5). Proměnná bude kvaniaivní spojiá a bude dosaova odno od 0 do. Obě proměnné jsou formovány z měsíční informaí, získaný v jednom deerminovaném momenu v čase počínají dubnem 004. Jsou vybrána daa isoriká se záměrem provés vyodnoení analýzy (jak endene ování, ak efekiviy předpovědi ododu klienů z banky) na skuečný dae (*). Tab 7-34 Převod skuečný odno poeniální renabiliy do inervalu (0,) Deily 3 4 5 6 7 8 9 0 Poeniální Poeniální renabilia_ renabilia_duben duben 004 004 v rozmezí (0,) -3.466,0503.965,50 5.434,50 9.48,3499 4.37,4498 0.9,550 7.5,650 38.55,7499 60.07,8503 57.437,950 Z abulky 7-34 je možné srovnáva odnoy z inervalu (0,) a jim ekvivalenní skuečné odnoy poeniální renabiliy. 7..3 Aplikae obené meodologie Daa použiá v následujíí aplikai jsou zpraována v souladu s následujíí dynamikou: výozí sav v počáečním období po prvnío yklu C je vořen pěi řídami, kde se akualizují objeky po čyři navazujíí ykly (každý yklus je složen ze ří období: první, meziobdobí a řeí 3 ) do maximálně šesi sluků způsobem, že v prvním yklu je jeden sluk rozdělen mezi dvě nové řídy, jeden je akualizován poybem a do zbývajíí jsou pouze klasifikovány objeky. V další ykle jsou sluky akualizovány meanikou a především ineligenní akualizaí (poyb v obou nebo jen v jedné proměnné). Neexisuje * Tak se aké provádí odnoení výkonnosi predikivní modelů v praxi.

97 řída, kerá by obsaovala nedosaečný poče objeků a proo žádný ze sluků nebude zrušen ani nebude kandidáem na svou eliminai. Vekory proměnný, keré definují sluky, jsou dva: : l X a X l. Analýza objeků ve smyslu jeji dynamiky je sledována mezi a 3 v obou proměnný odděleně. Vyvořená obená meodologie je aplikována na každý sluk zvlášť na koni každéo yklu, kdy je analyzován sav a ování objeků a v rámi sénářů změn vybírány formy akualizae formáů ování sluků. V příloze.6. jsou uvedeni sledovaní klieni Bi, mikropodnikaelé zemědělskéo sekoru, se svým idenifikáorem a ru, zařazením do původní sluků a s odnoami původní proměnný po všena sledovaná období čyř yklů. Sálá kriéria aplikovaná běem čyř analyzovaný yklů jsou následujíí: Výozí sav říd: {,,3,4, 5}. V eapě I, Idenifikae objeků, keré předsavují změnu, jsou yo v segmenu vzdálenosi následovně: S idenifikovány výpočem a porovnáním Eukleidovy Χ o X, jesliže V eapě II, Rozpoznání savu změny, je eno v segmenu kon po po max s d( Χ, s ) > d (plaí i pro S rozpoznán, jesliže e o S >. 0 N. V eapě III., Rozodnuí o možnose akualizae sluků, je provedena akualizae klasifikaí do sluku S Y ). S, jesliže pro obě proměnné sledované zvlášť plaí E ) nebo alespoň pro jednu proměnnou plaí s S 0.5 ( N S s ( E S ) 0.5 ( N ) S s, k s,( k ) > a zároveň pro ni plaí 0,5 ( E ) ( e ). S S V případě opačném, kdy alespoň jedna proměnná splňuje E ) s S > 0.5 ( N S, s,( k ) S S s k a zároveň splňuje aké 0,5 ( E ) > ( e ), doází k akualizai poybem sluků (v proměnné, kerá splňuje uvedená kriéria). Tyo akualizae jsou provedeny pro siuae, kdy není rozpoznán sav změny.

98 Při rozpoznání savu změny, kdy alespoň pro jednu proměnnou plaí E 0. 8 e o, s S o S nebo E o, s S + e 0. 5 N s S S, doází k vyvoření nový říd. V případě splnění obou dvou opačný kriérií je aplikována akualizae poybem sluků. Akualizae sředů říd při změně formáů ování alespoň v jedné proměnné se provádí MNČ. V eapě IV, Zrušení sluků, doází k eliminai sluku, jesliže S < 0.03 N a zároveň pro eno sluk e a i S Χ v kon plaí: Χ S v C až C (plaí pro každé období yklu). i + + V eapě V, Idenifikae rajekorií, jsou yo vyjádřeny spojnií T S, kerá přísluší vekoru, kerý obsauje rajekorie sluku S v čase, edy souřadnie svéo sředu v čase. Koefiien α rovný 0% je poměrně vysoe zvolená ranie změny, pro řešený případ však vodná. Exisuje oiž dosaečný poče říd a úmyslem není eno poče zvyšova. Co se ýče ování objeků: i když jsou nalezeny objeky sabilní v poybu v jedné nebo drué proměnné, sabilní objeků v poybu, majíí sejnou rajekorii v obou proměnný zároveň, je málo. Je proo volena sraegie ineligenní akualizae v případě, je-li ve sluku poče objeků se sabilním ováním alespoň v jedné proměnné >.5 (N ) S a zároveň poče objeků sluku sabilní v poybu s jisou rajekorií v éo 0 proměnné je věší víe než o 50% než je poče objeků poybujíí se ve sejné proměnné sabilním proisměrným poybem. To znamená, že rajekorie jsou konsruovány na základě alespoň jedné proměnné. Hranie 5% pro koefiien sabiliy objeků je volena z oo důvodu, že 5% sabilní objeků je považováno za kriérium dosaečně silné, aby molo bý mluveno o poybu sluku a na druou sranu dosaečně volné, aby molo bý s objeky v segmene zaázeno jako s prosředkem meody předpovědi ování objeků do budounosi; pro realizai pos segmenační akivi není řeba čeka na splnění kriérií s vyšší ranií sabiliy, nýbrž je řeba předem včas organizova a realizova následné konkurenční proesy na podpoření či posavení se endenčnímu ování objeků.

99 V řešeném příkladě nedoází k agregai nový klienů; jeji elkový poče mezi ykly se ovšem mění. Důvodem je ybějíí údaj někeré ze základní proměnný v někerém z yklů (období). V průběu analýzy není řeba měni na počáku definovaná kriéria, jelikož vyovují (*) jak při sledování eoregenní objeků, ak endene v poybu a směru. V opačném případě by byla upravována kriéria eap proesu (proena koefiienů). Počáeční sluky před jakoukoliv akualizaí vzorů ování sluků zobrazuje graf 7-0. Graf 7-0 Sluky v po V sournné abule 7-35 aplikae obené meodologie jsou ukázány lavní arakerisiky, keré v každé eapě (kromě řeí eapy, jelikož její vyjádření je komplexní) deerminují rozodování o výsledné akualizai. Akualizované sředy sluků jsou zobrazovány pro každý yklus v poslední dvou sloupí abulky. * Nedoází k aosu a je sledovaelná endene v poybu.

00 Tab 7-35 Carakerisiky sluků v průběu aplikae obené meodologie v C až C 4 Cykly Sluky IO PO N_ Ouliery yklus yklus 3 yklus 4 yklus Sředy _po Rozodování I. eapa % Oulierů Rozodování II. eapa Rozodování III. eapa Akualizovaná proměnná IO PO 0,63 0,86 53 5 I,M,N 6% I,M M 0,63 0,86 0,859 0,449 8 4 I,M,N 9% I,M M 0,859 0,449 3 0,56 0,0 70 5 I,M,N 9% I,M I IO 0,38 0,0 4 0,530 0,747 8 5 I,M,N 4% I,M M 0,530 0,747 5 0,6 0,4 70 4 I,M,N 5% I,N N z 5 => 5 a 6 0,73 0,37 Celkem 056 % 0,544 0,78 0,63 0,86 8 I,M,N % I,M I IO 0,69 0,86 0,859 0,449 9 I,M,N % I,M I IO 0,869 0,449 3 0,38 0,0 6 I,M,N % I,M M 0,38 0,0 4 0,530 0,747 78 5 I,M,N 3% I,M I IO 0,566 0,747 5 0,73 0,37 8 I,M,N 7% I,M I IO 0,764 0,37 6 0,544 0,78 36 7 I,M,N 3% I,M M 0,544 0,78 Celkem 97 34 3% Sředy _kon 0,69 0,86 0 I,M,N 0% I,M I PR 0,69 0,8 0,869 0,449 78 I,M,N % I,M M 0,869 0,449 3 0,38 0,0 33 0 I,M 0% I,M I IO,PR 0,5 0,8 4 0,566 0,747 9 I,M,N % I,M I PR 0,566 0,766 5 0,764 0,37 99 0 I,M 0% I,M I IO,PR 0,786 0,49 6 0,544 0,78 43 0 I,M 0% I,M I PR 0,544 0,335 Celkem 955 4 % N 0,69 0,8 43 0 I,M 0% I,M I IO 0,86 0,8 53 0,869 0,449 59 I,M,N % I,M M 0,869 0,449 48 3 0,5 0,8 5 0 I,M 0% I,M I PR 0,5 0,7 5 4 0,566 0,766 80 I,M,N % I,M I IO 0,66 0,766 74 5 0,786 0,49 7 I,M,N % I,M I PR 0,786 0,5 5 6 0,544 0,335 48 I,M,N % I,M M 0,544 0,335 56 Celkem 009 5 3% 008 Poznámka: IO vyjadřuje index ododu, PO poeniální renabiliu. Poslední, páá eapa proesu, srnuje konečné arakerisiky sluků při ukončení každéo časovéo yklu a promíá sav vývoje dynamiké segmenae. To umožňuje sledova konkréní savy sluků a jeji variae po reálný rajekorií svý sředů v čase, ož přísluší zodpovězení řeí oázky obodu. I když k řešení případu je jako opimální vybrána obená meodologie, ke srovnání a budouí analýze (provedené v seki 8) jsou sluky paralelně akualizovány dalšími dvěma meodami (sraegiemi) segmenae, kerými jsou klasiká meoda k-means a segmenae ve dvou fází. V příloze.7 je však možné sledova pě varian výsledků. Jelikož poče vzniklý přírodní říd se u jednolivý enik liší, pro efeky jeji srovnávání je řeba v každém yklu vyrovna poče říd (za základ je volen poče říd, kerý vyvořila obená meodologie). Tak vzniká k-means vyrovnaná a segmenae ve dvou fází vyrovnaná. Následně jsou ři výše popsané vyrovnané eniky segmenae prezenovány ve vývojový grafe 7- a) až ), keré dovolují sledova rajekorie sluků a výkyvy (aoiké ování) ve slukování. Pro vyodnoení kvaliy předpovědi vývojový endení savů sluků (ve smyslu endene zavří běžný úče a endene odno poeniální

0 renabiliy) a jeji srovnání se skuečně realizovanými sředy sluků v budounu jsou užiy dvě období, a o kvěen a červene 005 (yklus 4 končil březnem 005). V grafu 7- ) je realizováno popsané pozorování obenou meodologií. Graf 7- Trajekorie endene ování sluků v C až C 4 a) meodou segmenae ve dvou fází vyrovnaná b) meodou k-means vyrovnaná

0 ) obenou meodologií se znázorněním skuečný sluků v budouím období Poznámka: Křížky označují sředy sluků, keré jsou očíslovány. Posloupnos yklů je uvedena barevně v legendě - například: C_po vyjadřuje pro každý ze šesi sledovaný sluků. po Černé křivky vyznačují reálné (v případě obené meodologie) nebo idenifikované (v případě zbylý dvou sraegií) rajekorie akualizae vzorů ování sluků a naznačují endeni ování. Červené šipky vyjadřují skuečné savy sředů sluků v předpovězeném období. Tendene je rajekoriemi a šipkami pouze naznačena, ak jako i velikos poybu. Po akualizai arakerisik sluků na koni poslednío sledovanéo yklu jsou pro každý sluk navrnuy markeingové sraegie komerční kampaní, keré jsou předsaveny v abule 7-36.

03 Tab 7-36 Markeingové sraegie v 4 kon Proměnné Sluk Analýza Index ododu Poeniální renabilia sav nízká exrémně vysoká endene rose klesá sraegie Udržova sav exrémně vysoká průměrná endene rose konsanní průměrná sraegie Bez ake sav velmi nízká nízká 3 endene klesá flukuuje sraegie Bez ake sav vyšší vysoká 4 endene rose rose sraegie Maximální pozornos sav vysoká velmi nízká 5 endene rose rose sraegie Sledova sav průměrná podprůměrná 6 endene klesá rose sraegie Udržova Analýza a vyodnoení užiý enik (především z grafu 7-) ak jako návr pilonío projeku komerční kampaní, zakládajíí se na výsledný akualizaí, jsou provedeny v sekí 8. a 8..

04 8 VÝSLEDKY V seki 7 ukázal analyik na dae simulovaný a skuečný aplikai a funčnos obené meodologie - vše navržený eap a sénářů změn. Auomaikým sekvenčním proesem proázel prosřednivím meod a kriérií eapami proesu, keré dovolily pozna arakerisiky a ování objeků a sluků. Výsledkem aplikae obené meodologie jsou opimálně akualizované vzory ování. Proes vyázel ze srukury segmenů vyvořené před první akualizaí a poé v každém yklu z akualizované srukury sluků vyvořené v předozím období. Až doposud neexisovala meoda segmenae založená na dynamikém ování objeků. Teoreiky vzao by proo měla obená meodologie vyjadřova ování a savy v reálném (dynamikém) prosředí lépe než algorimy saiké právě díky zarnuí konepu dynamiky do slukování. Na povrzení éo ypoézy je řeba zavés konkréní kriérium a za jeo použií vyodnoi kvaliu akualizae, zdůrazni rozdíly ve výsledí aplikae obené meodologie a segmenae využívajíí exisujíí algorimů slukování a analýzou výsledků vyzdvinou přednosi použií obené meodologie v analýze slukování v praxi. 8. Konsruke kriérií na srovnávání algorimů Rozdíl mezi saikými a dynamikými algorimy segmenae je sledován ze dvou perspekiv. První je eniký přísup, kerý je zajímavý a důležiý především pro samoné modeláory, vybírajíí pro svou prái nejvodnější eniky a jeji meodologie. Vodnos eniky posuzují pro každý konkréní případ s úmyslem vybra u, kerou by došli k o nejkvalinějším výsledkům, keré by kopírovaly skuečnos, byly by replikovaelné a použielné v praxi. Použielnos vyvořenéo daaminingovéo modelu závisí aké na jeo snadné a rylé periodiké provedielnosi. Nejenom pomoí eniký aribuů je možné ukáza rozdíly a kvaliu segmenaí prováděný různými algorimy. Přínos daaminingový modelaí je v praxi měřen především jeji přímým finančním přínosem. Na simulovaná daa bude aplikováno eniké kriérium srovnání rozdílný algorimů segmenae a na skuečný dae bude předveden ekonomiký přísup

05 vyodnoení obené meodologie z poledu zisku vyplývajíío z předvídání budouío savu a ování sluků. Srovnávanými algorimy jsou obená meodologie, reprezenujíí dynamiký algorimus slukování, a dvě sraegie se saikým algorimem, zasoupené enikami k-means a segmenae ve dvou fází, předsavujíí logiký vývoj saikéo algorimu k dynamikému (*). 8.. Teniké kriérium V průběu práe je zdůrazňována důležios koninuiy vyvářený segmenaí a proo pořeba v každém novém yklu vyáze z akualizae vyvořené v předozím yklu. Kromě zajišění návaznosi proesů pos segmenae, jako jsou markeingové kampaně, fakem, že není vyvíjen úplně nový sysém segmenae, se šeří čas a práe speialisy a ím i finane. Požadavkem na výslednou segmenai je aké její kvalia ve smyslu přesnosi (nebo naopak yby) v konsruované segmenai. Teno požadavek je možné vyjádři průměrnou a maximální vzdálenosí objeků ke sředu svéo sluku. Jak již bylo předesláno, díky analýze dynamikéo ování objeků je možné pozna a sledova významné rysy v poybu a směru objeků a ak definova endeni v ování sluků. To dovoluje předpovída budouí vývoj a sav jak objeků, ak i sluků a konsruova ak nejopimálněji definované sluky, keré dovolí v relai s pos slukovými akiviami ovláda poyb objeků: podporova požadovaný směr či brzdi nežádouí ování. Tak je možné bý připravený (na rozdíl od konkurene) na budouí rend a mí náskok ve vyvozování včasný a reálný rozodování. V návaznosi na právě popsané požadavky arakerisik algorimu je možné zkonsruova ři aribuy pro srovnávání obené meodologie (OM) s každou ze sraegií (S): prvním je kvalia (yba) slukování; druým aribuem je čas pořebný na vykonání slukování (implikuje aké finanční náročnos) a posledním aribuem je dynamika, kerá vypovídá o sopnosi sraegie vyjadřova skuečnos, použielnos v praxi a kapaiu předpovída budouí vývoj sluků. * Sraegie I., III. a IV. ze seke.3..

06 Tenikým kriériem srovnávání algorimů je následujíí formule: M = [ ( OM j S j )* Pj ], kde 0 < Pj < v ( OM, S). j= Symbol v značí vzdálenos mezi odnoami aribuů OM a jednolivý sraegií, oeňovanými zvolenými vaami P ; symbol j značí aribu (zde {,,3,4 } j j ). Kvalia slukování je vyjádřena průměrnou a maximální Eukleidovou vzdálenosí objeků ke sředu sluku, čas v ýdne a dynamika binominální proměnnou s kvaliaivními odnoami ano a ne (*). Z důvodu unifikae jednoek aribuů pro účely srovnávání jsou yo vysupňovány v rozsau (, 0). Čím menší je yba v kvaliě slukování, menší čas pořebný na vývoj akualizovaný vzorů ování a čím dynamičější je sraegie, ím zápornější je odnoa aribuů. Je-li výsledkem kriéria v srovnávaný algorimů v elkovém porovnání vše zvolený aribuů číslo blízké -, pak víězí OM nad osaními sraegiemi; naopak, číslo blízké 0 vyrovnává rozdíly mezi OM a S a kladné číslo upřednosňuje někerou z odnoený sraegií. K posouzení ilivosi výsledku na jednolivé aribuy jsou zavedeny váy. Volba konkrénío enikéo kriéria je přikládána následujíím zdůvodněním: kriérium umožňuje sudova aribuy kvaliaivní i kvaniaivní a o naví v různý měrný jednoká, jelikož jeji odnoy je možné vysupňova mezi určiý inerval a praova ak s odnoami z ooo inervalu. Jsou uvažována různá lediska poledu na jeden problém. Uvedené eniké kriérium zarnuje aké subjekivní přísup, kerý je vykompenzován příomnými vaami, keré naví dovolují měři ilivos výsledku na míře zasoupení jednolivý aribuů. Nezanedbaelnou výodou je způsob inerpreae výsledku v proene. * Hodnoy někerý aribuů jsou přisouzeny na základě subjekivnío vyodnoení.

07 8.. Ekonomiké kriérium Před rozodnuím o implemenai meodologie je nuné ověři (na skuečný dae z minulosi) funkčnos obené meodologie z poledu idenifikae skuečný a předpovězený savů a poybů klienů. Následně je řeba analyzova její finanční přínos a proo realizova piloní projek využívajíí výsledky aplikae. Za ímo účelem je definován plán akivi na zadržení klienů v bane a sraegie odnoení plánu. Cílem je sousředi zdroje proakivnío zadržení klienů a obslouži s prioriou u skupinu klienů, kerá je arakerizována vyšší endení ododu z banky s endení růsu a zároveň vysokými odnoami akuální a poeniální renabiliy. Následuje kvaniaivní odad výnosu projeku. K odnoení je vybrán sluk číslo čyři, jelikož eno sluk obsauje klieny s vysokou poeniální renabiliou a vyšší rosouí mírou ododu; bude mí prioriní pozornos v plánu zadržení klienů v bane, kerou jsou konaky klienů s nabídkami produků z rodiny úvěrů; pro klieny s exra vysokou poeniální renabiliou a vysokým indexem úniku exisuje nabídka zrušení poplaků na rok 006 a pro všeny klieny sluku čyři je v plánu vyšeři jeji dojem a spokojenos se službami elé korporae. Pos segmenačními proesy je ak možné manipulova endenční ování klienů sluku (podpoři renabiliu či/i zabráni ododu) a ak konkurenčně využí příležiosi obodu. Je-li posouzen současný sav disribue klienů ve sluku ve smylu kvaliy (průměrné a maximální vzdálenosi objeků ke sředu sluku) a spolelivě předpovězen budouí poyb, je možné aplikova plán činnosi na zadržení klienů a počía s jeo finančním přínosem, kerý je oodnoen dle následujíí sraegie:. Jsou uvažovány dva sénáře odnoení: a. Pesimisiký sénář, ve kerém klieni udržují svou akuální renabiliu (nezvyšuje se index ross-sellingu ani up-sellingu). b. Očekávaný sénář, ve kerém jsou zadržení klieni renabilizováni na úroveň průměrné odnoy kliena segmenu, k jejíž odnoě směřují s rosouí endení.. Cílem plánu je sníži index uzávěrky běžnéo úču o 50%. 3. Předpoklady pro odnoení:

08 a. Současná odnoa kliena, kerý servává v průměru 4 roky v bane, pro časový orizon 3 le bankovní sazbou 5% ročně je $.067.740 ($40.465 měsíčně; pesimisa) nebo $.79.04 ($48.479 měsíčně; očekáváno). b. Konakabilia klienů elemarkeingem a jinými kanály remoo je 60% (proakivní oubound). 8. Vyodnoení kriérií srovnávání algorimů 8.. Vyodnoení enikéo kriéria Tabulka 8- předsavuje aribuy v jeji původní jednoká a aké v odnoá vysupňovaný do inervalu od - do 0. Tab 8- Původní a vysupňované odnoy aribuů sraegií Aribuy/Sraegie Hodnoy sraegií OM Vysupňované odnoy sraegií I. III. IV. V. I. III. IV. V. kvalia_průměrná vzdálenos 30,5 7, 0,5,4 0 - - 0,85-0,8 kvalia_maximální vzdálenos 66,5 5,8 3,,4 0 - - 0,86-0,89 čas 0 8 4-0 - 0,50-0,5 dynamika NE NE NE/ANO ANO 0 0-0,5 - Poznámka: Sraegie I. je k-means saiká, sraegie III. je k-means nově uvářená v každém požadovaném yklu, sraegie IV. je segmenae ve dvou fází, sraegie V. (OM) je obená meodologie. Aribu dynamika je oodnoen na bázi výsledků ze seke 7. Tabulka 8- předkládá výsledky srovnávání enikéo kriéria pro různé odnoy va aribuů. Tab 8- Výsledky srovnání sraegií enikým kriériem pro rozdílné váy Aribuy Váy_ Výsledky va_ Výsledky va_ Výsledky va_3 Váy_ Váy_3 V. x I. V. X III. V. x VI. V. x I. V. X III. V. x VI. V. x I. V. X III. V. x VI. j_ 0,5-0, 0,03 0,0 0,0-0,6 0,04 0,0 0,30-0,4 0,06 0,0 j_ 0,5-0,3 0,0-0,0 0,0-0,8 0,0-0,0 0,30-0,7 0,03-0,0 j_3 0,30 0,3-0,08 0,08 0,0 0,5-0,05 0,05 0,0 0,08-0,03 0,03 j_4 0,40-0,40-0,40-0,30 0,40-0,40-0,40-0,30 0,30-0,30-0,30-0,3 v -0,43-0,43-0, v -0,59-0,39-0,5 v -0,74-0,4-0,0 Aribuy Váy_4 Výsledky va_4 Výsledky va_5 Výsledky va_6 Váy_5 Váy_6 V. x I. V. X III. V. x VI. V. x I. V. X III. V. x VI. V. x I. V. X III. V. x VI. j_ 0,00 0,00 0,00 0,00 0,5-0,0 0,05 0,0 0,33-0,7 0,06 0,0 j_ 0,00 0,00 0,00 0,00 0,5-0, 0,03-0,0 0,33-0,30 0,04-0,0 j_3,00 0,75-0,5 0,5 0,5 0,9-0,06 0,06 0,33 0,5-0,08 0,08 j_4 0,00 0,00 0,00 0,00 0,5-0,5-0,5-0,9 0,00 0,00 0,00 0,00 v 0,75-0,5 0,5 v -0,49-0,4-0, v -0,3 0,0 0,08

09 Na základě výsledků v z abulky 8- je možné srnou, že pro věšinu kombinaí sraegií a va aribuů (*) je odnoa formule záporná, ož znamená víězsví OM nad osaními sraegiemi. Nejopimálnější výsledky podává OM díky zarnuí a vyodnoení ukazaele dynamiky. V případe nízké odnoy váy aribuu dynamiky je výsledek OM velmi podobný výsledku osaní sraegií, především sraegii segmenae ve dvou fází (kladné odnoy sraegií v dolní čási abulky 8-). Vysoké kladné odnoy pro někeré sraegie podává kriérium v případě va_4, kde je uvažován pouze aribu čas. Je-li dána všem aribuům sejná síla (váy_5), je možné konsaova, že OM je v sournu působení čyř deerminovaný aribuů o % nad S IV., o 4% nad S III. a o 49% nad S I. Teniké kriérium je indikáorem kvaliy eniký paramerů obené meodologie. Důraz je však v praxi přikládán především ekonomikému kriériu, keré uvádí obenou meodologii do praxe a odnoí konkréní finanční přínos. 8.. Vyodnoení ekonomikéo kriéria Aby komerční akiviy byly efekivní, je řeba aplikova v pravém momenu u správnou kampañ pro vybranou skupinu klienů. Při prái s day isorikými je aplikaí obené meodologie idenifikována evidenní růsová endene obou proměnný sluku 4 a ao je ověřena opakovanou konrolou ve dvou následný období: sřed sluku se naázel v předpovězeném směru endenčnío poybu. Při sledování arakerisik obené meodologie, dynamiky a sopnosi předpovědě budouí vývoj na další dvou analyzovaný eniká segmenae, z grafů 7- a 8-, je zřejmý aoiký poyb sředů každéo ze sluků v průběu yklů; naví není možné přesně zobrazi reálné rajekorie poybu pouze rajekorie idenifikované. Sluky jsou ak pouou foografií odno proměnný objeků v jednom momenu, ož nevyjadřuje ypiké ování objeků; není vyjádřena endene v poybu a udíž není možné předpovědě ování objeků (sluků) do budounosi. Proo navazujíí pos segmenační akiviy uplaňované na sluky akualizované meodami k-means či segmenae ve dvou fází budou časo konraprodukivní a ak neefekivní. * V daaminingové erminologii nazýváno Trade Off.

0 Graf 8- Tendene ování sluků vyjádřené obenou meodologií, k-means vyrovnanou a segmenae ve dvou fází vyrovnanou a skuečné sředy sluků v budouí období Poznámka: zobrazené ykly jsou redukovány na přelednosi). Zde například: C_po vyjadřuje po po, 4 kon a červene 005 (z důvodu. Všeny uvedené eniky mají počáek éměř ve sejném bodě, proo se barvy malý křížků, vyjadřujíí první yklus, překrývají. Velké křížky vyjadřují čvrý yklus. Budouím obdobím, kam by měly endenčně směřova sraegie, je čevene 005 - zobrazeno žluým křížkem. Na podpoření závěrů analýz je přiložen graf 8- vývoje sředů sluků vyjádřený obenou meodologií a segmenaí ve dvou fází aplikovaný na simulovaná daa. Z grafu 8- je možné srnou, že obená meodologie vyváří v C sluky přibližně na sejném mísě, kde je vyváří segmenae ve dvou fází, ovšem o jeden yklus déle, edy v C. Důvodem je eropiký poyb sluků vyvářený segmenaí ve dvou fází, kerý nesleduje dynamiku ování objeků. Proo v někerý případe doází k proisměrným poybům sluků mezi ykly, v jiný případe se sluk realizuje se zpožděním za sluky vyvořenými obenou meodologií.

Graf 8- Tendene ování vyjádřené obenou meodologií a segmenaí ve dvou fází na simulovaný dae Poznámka: velikos vězdiček se zvyšuje se zvyšujíím se počem yklů. Zde například: C po vyjadřuje po. OM vyjadřuje obenou meodologii. Pro konrolu kvaliy disribue klienů ve sluku je využi jeden z aribuů enikéo kriéria a o průměrná a maximální vzdálenos objeků ke sředům sluků. Hodnoy sledované v abule 8-3 povrzují kvaliu sloučení. Tab 8-3 Kvalia slukování v C4 vyjádřená obenou meodologií, k-means vyrovnanou a segmenaí ve dvou fází vyrovnanou Sluky Segmenae ve dvou fází vyrovnaná K-means vyrovnaná Obená meodologie Vzdálenos N Vzdálenos N Vzdálenos Průměr Maximum Průměr Maximum Průměr Maximum 0,64 0,3 96 0,65 0,344 74 0,65 0,304 53 0,68 0,93 37 0,58 0,44 68 0,3 0,8 48 3 0,07 0,359 37 0,60 0,37 0 0,78 0,330 5 4 0,5 0,367 86 0,5 0,37 0,78 0,396 74 5 0,60 0,43 09 0,57 0,37 66 0,38 0,34 5 6 0,70 0,8 58 0,43 0,3 95 0,50 0,306 56 Průměr 0,70 0,34 0,56 0,35 0,57 0,3 Je ak možné oeni, že obená meodologie je sopná předpovědě endeni ování sluků do budounosi a produkova kvaliní výsledné akualizae, na kerý je možné N

posavi sabilní, logiky navazujíí komerční kampaně (v omo případě se záměrem zabráni ododu z banky poeniálně renabilním klienům). V abule 8-4 je možné oeni, že zadržení plánovanéo poču klienů přinese dle očekávanéo sénáře roční užiek 30 miliónů ilský pesos (*). Jelikož sluk čyři by měl ve skuečnosi při odnoení elé báze 4.54 mikropodnikaelů, majíí běžný úče v Bi, druý sloupeček v abule 8-4 zpřeledňuje výnos zadržení plánovanéo poču klienů, kerý je v případě očekávanéo sénáře $875 miliónů. Při neexiseni plánu zadržení klienů by minimálně ao čáska byla odečena ze zisku korporae. Tab 8-4 Zodnoení plánu pos segmenační akivi obené meodologie jako ekonomiké kriérium Sluk 4 Rozšířený sluk 4 Namákou Konakovaní klieni 74 4 54 74 4 54 Index konakabiliy 60% 60% 60% 60% Klieni skuečně konakovaní 04 74 04 74 Index úniku v příším měsíi 4 4 0,4 Index zábrany úniku klienů 50% 50% 50% 50% Současná odnoa kliena zadrženéo na ři roky 067 740 067 740 Pesimisiký sénář Hodnoa zadržený úniků v následujíím měsíi 35 480 60 86 83 Jeden jediný sénář Hodnoa roční zadržení ($) 5 65 76 730 334 93 Současná odnoa kliena zadrženéo na ři roky 79 04 79 04 633 8 633 8 Očekávaný sénář Hodnoa zadržený úniků v následujíím měsíi 558 407 7 94 600 3 989 6 966 0 Hodnoa roční zadržení ($) 30 700 884 874 975 96 595 87 83 593 4 Poznámka: Rozšířený sluk čyři obsauje poče vše klienů z Banky Mikropodnikaelů, ne jen vybranou skupinu klienů zemědělskéo sekoru. Ve sluku 4 je index úniku 4,% (dle da isoriký). Ve sluku vybranéo namákou z elé populae klienů o sejném poču klienů jako rozšířený sluk 4, je index ododu klienů 0,4%. Too oenění vyjadřuje přínos, kerý je doílen vyvořením a užíváním predikivnío modelu. Porovnává efekiviu akivi pro případ práe s predikivní obenou meodologií a práe bez modelae případu daaminingovou enikou. V případě neexisene eniky, modelujíí endene ování skupin klienů dle indexu ododu a poeniální renabiliy, efekivia plánu zadržení klienů (se sejnými podmínkami jako bylo popsáno) by byla pro poče 4.54 klienů $83 miliónů (oproi $875 miliónům získaným enikou obené meodologie). * 00 ilský pesos je přibližně 4, Kč; jsou označovány $.

3 9 ZÁVĚR Na závěr práe lze konsaova, že bylo dosaženo zkonsruování sandardní, obené meodologie pro analýzu slukování dovolujíí opimálním způsobem, založeným na dynamikém ování objeků, akualizova objeky spolu se vzory ování sluků. Každý následný časový yklus navazuje na akualizai provedenou v předešlém yklu. Obená meodologie vyváří, flexibilizuje a auomaizuje proesy daaminingovéo modelování maximalizují příležiosi obodů, keré se zráely jednak v důsledku neexisene dynamiké eniky slukování, sopné vyjádři reálné proesy na ru a aké zpožďováním rozodování. Vyvořená obená meodologie je přínosem především pro odvěví dynamikéo a predikivnío Daa Miningu a Business Inelligene. 9. Poled na obené arakerisiky obené meodologie Zlepšení a inovae, kerý obená meodologie v odvěví segmenae doílila, jsou znaelné při její aplikai a využiy v praxi. Jsou jimi arakerisiky popsané v následujíí odsaví. Jednou z výod je auomaiký sekvenční proes průodu eapami a výběru sénářů změny. Tao arakerisika dovoluje užíva obenou meodologii a provádě dynamikou segmenai i osobám, keré nejsou expery v modelai siuaí enikami Daa Miningu. Teno fak spolu s ím, že akualizae navazuje v každém yklu na akualizai provedenou v předešlém yklu, šeří nejen čas, ale i finane insiui, kerá ji bude periodiky používa. Obená meodologie je vyvořena na základě obený arakerisik. Je vodná pro jakýkoliv případ slukování, popisujíí reálné změny na ru (kde exisuje dynamika), jelikož je prakiky šiá na míru, edy na každý jednolivý případ. Příčina právě řečenéo je následujíí: obená meodologie není omezena aplikaí, meodami, paramery ani kriérii rozodování, jelikož yo jsou snadno modifikovaelné. Je možné ji provádě jakoukoliv enikou segmenae za použií libovolnéo daaminingovéo sofware. Sejně ak není omezena počem proměnný vložený do analýzy. Je nadsavbou pro případy, kdy objeky, keré přiázejí do báze da, nevlasní žádnou idenifikai. Její využií je především pro objeky idenifikované, jejiž ování

4 je možné sledova v průběu času; nedoází ak ke zráě informae. Naví je možné zařazova v průběu analýzy i objeky nové, ak jako je možné další objeky v případě pořeby eliminova. Ne auomaiky je informae o objeke, keré jsou idenifikovány jako objeky ve savu změny, zařazena do formáů ování. Jelikož úsilím je udrže o možná nejsabilnější markeingovou kampaň (jako jakýkoliv proes, ke kerému doází v průběu živoa sluku), účelem je provádě pouze nevynuelné změny ve formáe ování; zároveň je však nuné respekova reálné a podsané změny v okolí a přenáše je do arakerisik sluku (*). Je nezbyné v každé rozdílné siuai bý flexibilní a sopný ryle a přesně rozodova ve smyslu jisé nabídky určié skupině klienů. Proo výoda, uvedená jako následujíí, by měla bý považována za jednu z nejpodsanější. Je jí sopnos obené meodologie předpovída ování objeků do budounosi. Exisují saisiké a daaminingové eniky a meody, pomoí kerý je možné předvída ování objeků do budounosi, ož je aké jeji exkluzívním účelem. Segmenae je řazena mezi analýzy deskripivní, ož znamená, že nevlasní arakerisiku předpovědi do budounosi. Přeso však obená meodologie dokáže využí eniky segmenae k právě popsanému účelu, ož je pro všeny insiue ve sále se zosřujíím konkurenčním prosředí živoně důležié. Obená meodologie zprosředkuje deailní poznání ování objeků a idenifikuje evidenní změny v sysému pro výběr nejvodnější formy akualizae. Tím je sopná předpovědě endeni ování sluků do budounosi - produkuje kvaliní výsledné akualizae, na kerý je možné posavi sabilní, logiky navazujíí komerční kampaně. Je založena na segmenai z předozío yklu, proo nedoází ke zráě informae; je možné sledova koninuální vývoj proesu pos segmenae. V akualizai vzorů ování sluků je posupováno endenčně, bez enropie, ož snižuje poče nejrůznější nadbyečný pos segmenační proesů, keré bývají aoiké, draé a v průběu času nemají reálný efek. Touo výodou předvídání budouío savu objeků a konsrukí nejvodnější akualizae vzorů ování je v časové posloupnosi vyjadřování savu a poybu sluků * Markeingové kampaně jsou vázány na mnoo fakorů, kerými je období nabídky, prosředky a mediální kanály konaku klienů, nabídka další produků, konkurenční prosředí a mnoo další.

5 obená meodologie o yklus nebo několik yklů napřed oproi až doposud nejsofisikovanějšímu algorimu segmenae ve dvou fází. Nezanedbaelnou výodou obené meodologie je aké její kvalia (přesnos) z poledu povšené vzdálenosi objeků ke sředu svéo sluku a proo pos slukovaí proesy budou vodně reprezenova všeny objeky sluku, pro keré jsou vyvořeny. 9. Teniký a ekonomiký poled na obenou meodologii Z výsledků realizae aplikae algorimů na simulovaný a skuečný dae je možné srnou eniké a ekonomiké výody obené meodologie srovnávané se saikými algorimy segmenae. Teniké kriérium je indikáorem kvaliy eniký paramerů obené meodologie. Analýza Trade Off poskyuje kvaliní výsledky ve smyslu kvaliy slukování a dynamiky. Důraz je však přikládán ekonomikému kriériu, keré uvádí obenou meodologii do praxe a odnoí konkréní finanční přínos. Při prái s day z minulosi byly aplikaí obené meodologie idenifikovány a ověřeny evidenní endene v ování objeků. Pos segmenačními proesy je ak možné manipulova předpokládané endenční ování (podpoři renabiliu či/i zabráni ododu) a ak ryle a konkurenčně využí příležiosi obodu. Při sledování arakerisik obené meodologie - dynamiky a sopnosi předpovědě budouí vývoj - na další dvou analyzovaný meodá saiké segmenae, je zřejmý aoiký poyb sředů každéo ze sluků v průběu yklů; sluky nevyjadřují endeni v poybu a udíž není možné předpovědě ování objeků (sluků) do budounosi. Proo navazujíí pos segmenační akiviy, uplaňované na sluky akualizované enikou k-means či segmenae ve dvou fází, budou časo konraprodukivní a ak neefekivní. Jelikož byla ověřena kvalia savu disribue objeků ve sluku (průměrné a maximální vzdálenosi objeků ke sředu sluku) a spolelivě předpovězen budouí poyb, je možné aplikova plán činnosi na zadržení klienů a počía s vyčísleným finančním přínosem, kerý je $875 miliónů ročně (pro 4.54 mikropodnikaelů zemědělskéo sekoru Banka Mikropodnikaelé, ož je sluk s vysokou poeniální renabiliou a vyšším indexem ododu).

6 9.3 Markeingový poled na obenou meodologii Jelikož vyváření obené meodologie dynamiké segmenae kladlo důraz na její prakiký význam a užií, z markeingovéo lediska je významný poznaek o vorbě a poču nový říd. Bylo předesláno, že sanovení poču sluků je v oblasi slukové analýzy až dodnes významným émaem výzkumu. V éo prái byl dán v podsaě volný průbě vyváření nový říd bylo řečeno, že v případě volby sénáře vorby nový říd bude jedna řída rozdělena mezi dvě nové a maximální poče říd bude 0. Naví, nový sluk byl vyvořen na základě náročný kriérií (koefiien ranie sabiliy oulierů γ a koefiien ranie vorby nový sluků δ). Po zodnoení názorů produk a segmen manažerů na oo éma je možné konsaova, že uživaelé nejsou ooni zrai dynamiky poeniálně se vyvářejíí řídy, keré moou bý zajímavé a keré r jako elek neregisruje; ím může vzniknou konkurenční výoda. Je proo usanoveno pravidlo sanovení poču nový říd na základě kriérií podporovaný obenou meodologií a markeingem (ne saisiky). Další komenář markeingu se ýká sluků, keré mají menší než minimální možný poče objeků (koefiien ω). Příčinou akovéo savu může bý například skuečnos, že slukům nebyla věnována dosaečná pozornos a proo yo případně významné sluky zanikají. Z oo vyplývá poznání, že je řeba sanovi rozdílnou odnou pro každý sluk a akzvaně získa významné segmeny, ať již jsou jimi nové sluky či sluky s kolísavým (nízkým) počem objeků. V návaznosi na o je nuné periodiky sledova reaki sluků na komerční nabídky a případně vyvoři podskupiny v samoný sluí na oddělení různý forem efeků odpovědí na nabídku. Je řeba podoknou, že je výodnější provádě pos segmenační akiviy pro segmeny, keré jsou sledovány v průběu času, než pro osamoené objeky a o z následujíí důvodů: je moniorováno ování skupin, ne osamoený objeků a je ak možné ujednoi ake proesu pos segmenae a ak sníži náklady; vyvořením skupin jsou deekovány poeniálně zajímavé nově se vyvářejíí sluky a aké sluky zanikajíí. Deekí endenčnío ování skupin objeků je možné provádě akiviy, keré zabrání nepožadovanému vývoji ování sluků. Vyváření a sledování dynamiký sluků má mnoonásobné užií. Naví, má sejnou efekiviu jako sávajíí predikivní model Bi

7 uzavření běžnéo úču pro jednolivé klieny (efekivia, sledovaná z poledu endene ododu klienů a poé jeji rozdělení do skupin). 9.4 Hodnoení výkonnosi obené meodologie jako meody dynamiké segmenae Daa Miningu Při implemenai obené meodologie do praxe se doporučuje sledova její výkonnos. Kromě odnoení eniký kriérií je řeba mí na mysli, že efekiviu obené meodologie není možné srovnáva s žádným isorikým sudiem, jelikož neexisuje. Segmeny nemají žádný koefiien na srovnávání vodnosi modelu (*). Kvalia slukování se posuzuje dle prakikéo využií a funkčnosi modelu v elku následný proesů. Jedná se o prokázání, že objeky zařazené do sluků, akualizovaný obenou meodologií, reagují na nabídku (snížuje se index ododu, zvyšuje se renabilia); efekiviu výsledku reakí na nabídku je možné srovnáva s efekiviou kampaní realizovaný v minulosi. Při realizai aplikae obené meodologie jsou vyslovovány jisé ypoézy o budouím ování sluků (na základě poču objeků, vzdálenosí objeků ke sředům sluků a přemíťování objeků). Tyo ypoézy moou bý porovnávány (povrzovány) s výsledkem řešení, získanéo z aplikae kriérií a paramerů obené meodologie, kerý je promíán v průběu yklů v abulká savu rozodování na koni každé eapy. Teno způsob srovnávání je možné považova jednak za jeden způsob konroly funkčnosi obené meodologie (druým způsobem jsou eniká kriéria na srovnávání saikéo a dynamikéo algorimu) a aké za formu předvídání (prognóz) akualizaí formáů segmenů mezi obdobími, keré jsou vyslovovány dále aké na základě sledování reálný rajekorií poybu sluků mezi ykly. 9.5 Budouí výzkum, alernaivní návry řešení Obená meodologie je úvodem do dynamiké segmenae - má za úkol zkonsruova sénáře a eapy průodem ěo sénářů, nemá však za úkol vyčerpávajíím způsobem * Srovnávání vodnosi modelu neprobíá jako u regrese nebo neuronové síě (například RMS MAX Training y Tes Errors) nebo u fuzzy C-means (RMS MAX Training y Tes Errors, Pariion oeffiien).

8 poskynou všena možná řešení. Proo daný problém má dlouou rajekorii budouío výzkumu, kerá se ýká například rozšíření řešení v jednolivý eapá obené meodologie idenifikovaný v éo prái či uplanění rozdílný meod a kriérií v ěo eapá proesu; někeré návry jsou popsány v následujíí odsaví. Například v eapě I., Idenifikae objeků předsavujíí změnu, v kriériu definie (seke 6..) je možné míso užívání ranie eerogeniy, vyjádřené Eukleidovou vzdálenosí, realizova difusní elky (pomoí Fuzzy C-Means) a ak arakerizova příslušnos objeků ke slukům. Další forma, jak vyřeši eno problém, je zapraova neuronální síť, kerá by klasifikovala do dvou savů: se změnou a beze změny. Vzorem pro objeky beze změny by byly akové objeky, keré by po jisé časové období nezměnily příslušnos a vzdálenos ke sředu sluku a vzorem pro objeky se změnou by byly objeky vzdálené sloučeným elkům. Jednodušší alernaivou na zlepšení by molo bý užívání vzdálenosi Maalanobis. V eapě III., Rozodnuí o možnose akualizae sluků, je možné pokračova ve výzkumu například v případě, že by měl bý překročen maximálně sanovený poče sluků. V omo případě by došlo ke sloučení sluků. Pravidlem na sloučení by mola bý kombinae například následujíí kriérií, jejiž analýza v prái nebyla proloubena: dojde ke sloučení dvou sluků, popřípadě věšío poču segmenů, jejiž sředy jsou si nejblíž; zároveň bude brán v úvau směr poybu a průměrná vzdálenos objeků ke sředu svéo sluku. Problému poču sluků je možné předejí výběrem opimálnío poču sluků pomoí koefiienu BIC (*) a ímo způsobem vybra en poče říd, kerý by měl nejvyšší odnou uvedenéo indexu. Exisují i negaivní názory na skuečnos, že obenou meodologii je možné modifikova na míru každému jednolivému případu. To oiž vyžaduje úpravu paramerů kriérií eap proesu dle konkréní podmínek. Tao arakerisika pak nemusí dovoli užíva obenou meodologii a provádě dynamikou segmenai osobám, keré nejsou expery ve zmíněné modelai nebo nemají možnos spolupraova s oddělením markeingu. Markeingový analyik by se měl ovšem vždy zúčasni defini a přípravy realizae obené meodologie a ak rozodova například o om, jak dlouý yklus je řeba vyvinou ke * Bayesian Informaion Crierium.

9 sledování ování, aby bylo možné emiova kvaliní a spolelivé předpovědi. V případě ransendenní událosi v modelované skuečnosi je nuné vyvíje a analyzova segmeny po několik yklů před vyslovením závěru o endeni ování sluků (*). 9.6 Doporučení V případě, že obená meodologie nepodává požadované výsledky ve smyslu idenifikae endene poybu nebo nesplňuje kriérium kvaliy slukování ve smyslu přesnosi, alernaivy zlepšení funkčnosi obené meodologie pro prakikéo uživaele moou bý následujíí: Přeodnoi odnoy používaný paramerů alfa až omega. Zvýši poče sledovaný období na prodloužení yklu. Přeodnoi užií navrovaný proměnný. Zdokonali ake pos segmenae, keré vedou objeky požadovaným směrem. Kombinova obenou meodologii či meody v jednolivý eapá s dalšími ineligenními daaminingovými enikami - například ěmi, keré slouží vyradně pro předpověď. * Tak obeně operují predikivní modely.

0 9 0 LITERATURA [] Anonsson E.K., Lee C.Y.: Dynami Pariion Clusering Using Evoluion Sraegy. Tird Asia Paifi Conferene on Simulaed Evoluion and Learning. Nagoya, Japan říjen 000. [] Barni M., Cappellini V., Meoi A.: Commens on a Possibilisi Approa o Clusering. IEEE Transaions on Fuzzy Sysems, srpen 996, svazek 4, číslo 3, sr. 393 396. [3] Bauis R., Sanlemene H. Harrison: Desubrimieno de Conoimieno en Bases de Daos Médias. XXIV Conferenia Lainoameriana de Informáia, Quio Euador, 9. až 4. října 998, svazek, sr. 037-048. [4] Blak M.M., Hikey R.J.: Mainaining e Performane of a Learned Classifier under Conep Drif. Inelligen Daa Analysis, prosine 999, svazek 3, číslo 6, sr. 453-474. [5] Crespo F.: Agrupamieno dinámio on lógia difusa. Memória para opar al Tíulo de Ingeniero Civil Indusrial. Universidad de Cile, Cile 00. [6] Dingsøyr T., Lidal M.E.: An Evaluaion of Daa Mining Meods and Tools. p://www.idi.nnu.no/~dingsoyr/proye/repor.ml. [7] Fayyad U.M.: Daa Mining and Knowledge Disovery: Making Sense Ou of Daa. IEEE Exper, Inelligen Sysems & Teir Appliaions, říjen 996, svazek, číslo 5, sr. 0-5. [8] Frédéri D., Le Barzi J.F.: Analyse des données évoluives, méodes e appliaions. Ediion Tenip, Paříž 996. [9] Geman S., Geman D.: Soasi relaxaion, Gibbs disribuions and e Bayesian resoraion of image. IEEE ransaions on Paern Analysis and Maine Inelligene, 984, svazek 6, sr. 7-74. [0] Han J., Kamber M.: Daa Mining: Coneps and Teniques. Morgan Kaufmann publisers, 00. [] Jain A.K., Duin R., Jianao Mao R.: Saisial Paern Reogniion: A Review. IEEE Transaions on Paern Analysis and Maine Inelligene, leden 000, svazek, číslo, sr. 4 37.

[] Joengen A., Mikenina L., Weber R., Zimmermann H.J.: Dynami Daa Analysis: Problem Desripion and Soluion Approaes. W. Brauer (ed.), Fuzzy Neuro Sysems 98 Compuaional Inelligene. Infix, Sank Augusin, sr. 8-89. [3] Joengen A., Mikenina L., Weber R., Zimmermann H.J.: Dynami Daa Analysis: Similariy Beween Trajeories, W. Brauer (ed.), Fuzzy Neuro Sysems 98 Compuaional Inelligene. Infix, Sank Augusin, sr. 98-05. [4] Kandel A.: Fuzzy Teniques in Paern Reogniion. Jon Wiley & Sons, New York 98. [5] Karypis G., Han E.H., Kumar V.: Camaleon: Hierarial Clusering Using Dynami Modeling. Compuer, Compuer Soiey IEEE, srpen 999, svazek 3, číslo 8, sr. 68 75. [6] King Sun Fu: Digial Paern Reogniion, Seond Correed and Updaed Ediion. Communiaion and Cyberneis, svazek 0, Berlín 980. [7] Krisnapuram R., Keller J.M.: Te Possibilisi C-Means Algorim: Insigs and Reommendaions. IEEE Transaions on Fuzzy Sysems, srpen 996, svazek 4, číslo 3, sr. 385 393. [8] Krisnapuram R., Kim J.: A Noe on e Gusafson-Kessel and Adapive Fuzzy Clusering Algorims. IEEE Transaions on Fuzzy Sysems, srpen 999, svazek 7, číslo 4, sr. 453 46. [9] Krzanowski W.J., Marrio F.H.C.: Mulivariae Analysis. Par : Classifiaion, ovariane sruures and repeaed measuremens. Londres: Arnold 995. [0] Lebar L., Morineau A., Piron M.: Saisique Exploraoire Mulidimensionnelle. Paříž: Dunod 995. [] Li R., Mukaidono M.: A Maximun-Enropy Approa o Fuzzy Clusering. Inernaional Join Conferene of Seond Inernaional Fuzzy Engineering Symposium and e Foure IEEE Inernaional Conferene Fuzzy Sysems and (FUZZ/IEEE- IFES), Japan, Yokoama březen 995, sr. 7 3. [] Mangin L., Varela Mallou J.P.: Análisis mulivariable para las ienias soiales., Madrid: Prenie Hall, España 003, sr. 47 449.

[3] Medel F.R.: Creaión y prueba de una meodología para árboles de deisión en Daa Mining dinámio. Tesis para opar al grado de magíser en gesión de operaiones. Universidad de Cile, Cile 00. [4] Pal K.R., Bezdek J.C.: On Cluser Validiy for e Fuzzy C-Means Model, IEEE Transaions on Fuzzy Sysems, srpen 995, svazek 3, číslo 3, sr. 370 379. [5] Ragavan V., Hafez A.: Dynami Daa Mining. 3 Inernaional Conferene on Indusrial and Engineering Appliaions of Arifiial Inelligene and Exper Sysems, USA 000. [6] Sapora G.: Probabiliés, Analyse des Donées e Saisique. Édiions Tenip, Paříž 990. [7] Tou J.T., González R.C.: Paern Reogniion Priniples. Addison-Wesley Publising Company, Massauses 974. [8] Ugoff P.E.: ID5: an inremenal ID3. Proeedings of de Fif Inernaional Conferene on Maine Learning, San Maeo, CA: Morgan Kaufmann 988, sr. 07-0. [9] Ugoff P.E.: Inremenal Induion of deision rees. Maine Learning, 4, 989, sr. 6-86. [30] Ugoff P.E., Berkman N. C., Clouse J.A.: Deision ree induion based on effiien ree resruuring. Maine Learning, 9, 997, sr. 5-44. [3] Wang L.X.: A Course in Fuzzy Sysems and Conrol. Prenie Hall, New Jersey 997. [3] Wasserman P.D.: Advaned Meods in Neural Compuing. Van Nosrand Reinold, New York 993. [33] Weber, R.: Daa Mining en la Empresa y en las Finanzas Uilizando Tenologías Ineligenes. Revisa Ingeniería de Sisemas, Deparameno de Ingeniería Indusrial, Universidad de Cile, červen 000, svazek XIV, číslo, sr. 6-78. [34] Weber R.: Fuzzy ID3: A lass meods for auomai knowledge aquisiion. Proeedings of e nd Inernaional Conferene on Fuzzy Logi and Neural Neworks, Iizuka, Japan 99, sr. 65-68.

3 PŘÍLOHY. METODY VÝPOČTU VZDÁLENOSTI (PODOBNOSTI) A PŘÍPADY JEJICH POUŽITÍ (sr. 35) yp proměnné meody na výpoče podobnosi yp proměnné meody na výpoče podobnosi yp proměnné meody na výpoče podobnosi yp proměnné meody na výpoče podobnosi yp proměnné meody na výpoče podobnosi binární jednoduá souvzažnos koefiien Sorenson koefiien Jaard koefiien Sokal y Snea spojié Eukleidova vzdálenos nominální ransformova na binární proměnné jednoduá souvzažnos ordinální praova s nimi jako by byly spojié směs ignorova různorodos realizova různorodé analýzy ransformova kvaniaivní proměnné na kvaliaivní koefiien Gower

4. SOUHRN SYMBOLŮ, DEFINIC A PARAMETRŮ (sr. 57) Poznámka: symboly, definie a paramery jsou uvedeny dle jeji posloupnosi v exu. N poče známý objeků. N poče agregovaný objeků. N elkový poče objeků; N = N + N. M X Y poče proměnný. maie N x M s odnoami známý objeků, kde každý sloupe obsauje odnoy proměnný objeku Χ. maie N x M s odnoami agregovaný objeků, kde každý sloupe obsauje odnoy proměnný objeku Y ; (objeky Χ a Y jsou ve skuečnosi vekory objeku i přes všeny proměnné - zde pojmenovány pouze objeky). S sluk S, kde {,..., S}. s sřed sluku S. s sřed konkrénío sluku S. Objek Χ nepaří do S : S i Χ. i d s m, s ) vzdálenos mezi sředy sluků S m y S n; m, n {,..., S}, kde m n. ( n d ( Χ, s ) vzdálenos mezi známým objekem Χ a sředem sluku s. po s d max ranie eerogeniy; vzdálenos nejvzdálenějšío známéo objeku Χ ke sředu s svéo příslušnéo sluku Χ. o X oulier známéo objeku o e S poče oulierů sluku S. C yklus C, kde {,...,C} l období l s X objek ns X objek kon. S v období před modifikaí po. yklu. je složen z časový období: C { k } Χ sabilní, neeropiký v poybu. Χ nesabilní, enropiký (aoiký) v poybu. = k poče uvažovaný období k definii neenropikéo ování. /. i kon

5 Poznámka: kon kon + kon, jesliže, jesliže je definováno následovně: kon je lié číslo, kon je sudé číslo. U maie N x M rajekorií objeku s X v yklu. U ij prvek maie U. U k rajekorie ypu k objeku s X v yklu. s k e, S poče s X sluku S, keré mají rajekorii ypu k. s E nejveší poče X i sluku S se sejnou rajekorií (sejným směrem); s S s, Maemaiky, E = max{ e } k. S k K U S rajekorie, po keré se poybuje MNČ v yklu. s S s E S sluku S a aké rajekorie sluku meoda nejmenší čverů. Výpočíává souřadnie sředů suků. Maemaiky min d( Χ i, s ). i = N v éo prái MNČ ( ) S o s E, S nejvěší skupina Χ sluku o, s S s rajekorií o U S. o U S rajekorie oulierů sluku S, kerou se poybuje s e S poče s es S s Χ sluku S U rajekorie e ; U = s S E, sluku S. o s S S se sejnou rajekorií jako je rajekorie s e S o U S. E,. o s S P paměť regisru; maie S x s objeky P S, kerá regisruje exiseni objeků { X } i řídy S v každém časovém období l. P S vekor sluku S v časový období l (obsauje odnoy 0 a ). T rajekorie vzorů ování; maie S x C, jejíž objeky voří souřadnie sředů sluků v časový ykle. T S vekor rajekorií; obsauje souřadnie sředu S v časový ykle.

6 Celky { S / { S } { / l {,..., kon } CS =,..., elek sluků. CT = elek časový období. l { C / { C}} CC =,..., elek yklů. + Poznámka: V prvním yklu je po =. V další ykle je = sluků. { k k je rajekorie} K = / elek odno po kon. kon je období U ij v jednolivý časový odobí. 3 po akualizai Paramery α β γ σ ω ranie změny. ranie sabiliy objeků. ranie sabiliy oulierů. ranie vorby nový sluků. ranie minimálnío možnéo poču objeků. C max maximální poče yklů (období), po keré řída s nedosaečným počem objeků udržuje paměť, zaímo jí není přiřazen objek. Poznámka: Symboly,definie a paramery se vzaují aké na agregované objeky Y.

7.3 ETAPY SE SVÝMI PODMÍNKAMI, KRITÉRII A PARAMETRY (sr. 57) Eapa I. Idenifikae objeků, keré předsavují změnu. Podmínka : definie kriéria ranie eerogeniy Je dán sluk S, yklus C a období l. Je definováno po { po d po max s = max dχ }, s. i Poom S, Χ i S jsou objeky předsavujíí změnu idenifikovány podmínkou : kon po : d( po, s ) d max s Podmínka > Χ. Vzdálenos po max s d reprezenuje ranii eerogeniy. Eapa II. Rozpoznání savu změny. Podmínka : definie kriéria ranie změny o S, i S Χ plaí: o es Podmínka : > α, kde 0 < α <. N Koefiien α předsavuje ranii změny. S Definie neenropikéo poybu, Χ i S, j S ij l+ l a) Χ > 0 { }, kde CT / l {,..., kon} ij = a l Χ jako sabilní poziivní, ij ij Χ jako sabilní negaivní, l+ l b) Χ < 0 ij ij Χ jako sabilní konsanní. l+ l ) Χ = 0 > kon je definován poyb: Definie neenropikéo směru s S, i S rajekorií Χ, j { }, kde CT / l {,..., kon} = a U, jejíž elemeny jsou vyjádřeny následovně: l U i j = 0 > kon je definována maie, je-li poyb sabilní poziivní,, je-li poyb sabilní konsanní,, je-li poyb sabilni negaivní.

8 Pro X je definován vekor s i U k jako rajekorie ypu k. Pod rajekorií se rozumí elek odno U ij v jednolivý období (rajekorie předsavují řádky v maii rajekorií jako K { k / k je rajekorie} vyjádřen jako s k S U ). Dodaečně je definován elek s =. Poče X i sluku S, keré mají rajekorii ypu k, je e, s, ; naví E max{ e } k S s = reprezenuje nejvěší poče X i sluku S se sejnou k K rajekorií; jeji rajekorie (a aké rajekorie sluku s S S ) je označena poyb a poybujíí se po sejné rajekorii mají neenropiký směr. U S. Skupinky objeků majíí sabilní Eapa III. Rozodnuí o možnose akualizae sluků. Akualizae klasifikaí do říd. Podmínka 3: definie kriéria ranie nesabiliy objeků s S, Χ i S plaí: s ES Podmínka 3 : β, kde 0 < β < N S Koefiien β přísluší ranii sabiliy objeků.. Akualizae poybem říd. Podminka 4: definie kriéria ranie sabiliy objeků (dodaek; opak k podmíne 3) s S, i S Χ plaí: s ES Podmínka 4 : > β, kde 0 < β <. N S Definie rajekorií oulierů a objeků (sabilní v poybu) ve sluí s rozpoznaným savem změny: Ať o U S je rajekorie Χ sluku o, s S a s o E, S je nejvěší skupina Χ (z elkovéo poču o, s o e S oulierů sluku S ) s rajekorií o U S. Je definováno, že s e je poče Χ i sluku s S S se sejnou rajekorií jako je rajekorie o s E, S, o znamená s es S U = o U S. Akualizae vorbou nový říd. Podmínka 5a: definie kriéria ranie sabiliy oulierů, o, s Χ i S plaí: S

9 Podmínka 5a : E e o, s S o S γ, Koefiien γ přísluší ranii sabiliy oulierů. nebo kde 0 < γ <. Podmínka 5b: definie kriéria ranie vorby novéo sluku s o, s, Χ, Χ S plaí: S Podmínka 5b : E s, o S N + e S s S δ, kde 0 < δ <. Koefiien δ přísluší ranii vorby nový sluků. Poznámka: Evenuelně se moou splni zaroveň obě podmínky 5a y 5b. Při splnění obou opačný podmínek je realizován poyb říd. Eapa IV. Zánik sluků. Podmínka 6a: definie ranie minimálnío možnéo poču objeků S, i S Χ plaí: es Podmínka 6a : < ω, kde 0 < ω <. N Koefiien ω je ranie minimálnío možnéo poču objeků. Podmínka 6b: definie ranie času pozorování Χ S jesliže je splněno: d ( Χ, s ) < d( Χ, s ), S, Χ i S. Dodaečně se požaduje, že je-li a i S Χ v kon, pak: Podmínka 6b : Χ v až S C Cmax. i + Eapa V. Idenifikae rajekorií. T je maie S x C, kde každá řádka reprezenuje souřadnie sředu každéo sluku v čase, o znamená v posledním období každéo yklu. souřadnie svéo sředu v čase. T S přísluší vekoru, kerý obsauje rajekorie sluku S v čase, edy Poznámka: Všeny uvedené vzay se se vzaují aké na agregované objeky v kon každéo yklu. Y. Podmínky se aplikují

30.4 DATA SIMULOVANÉHO PŘÍPADU (sr. 59 a dále) Poznámka: Exisuje 3 sloupů a 06 objeků. Nejprve je uvedeno první 6 sloupů a 70 objeků. Na další sraně pokračují y samé sloupe se zbývajíími objeky. Následují sloupe 7 až 30 s rozdělením objeků na prní 30 a zbývajíí 3 až 06 objeků. Někeré sloupe vlasní ybějíí údaje je možné je naradi odnoou 0. Index u sluků vyjadřuje časové období a yklus pro objeky. 3 4 5 6 7 8 9 0 3 4 5 6 Idenifikáor ( S ) po d ( Χ, s ) X 3 i X i X X i ( S ) i X 3 i i 3 3 X d (, s ) o( ( ) Χ 3 ) o,s ( ) s 3 X X 3 X i s( 3 ) X s ( 3 ) i X 3,9 0 0 0 39 3 6 0,90 0 0 0-0,37 0 0 5 33 6 30 5,00 0 0 99 99 0 3,59 0 9 3 33 3,40 0 0 99 99 0 4,9 0 0 5 7 0,50 0 0 99 99 0 5 7,3 0 0 3 8 3,30 0 0 99 99 0 6 4,08 0 0 4 3 5 6,0 0 0 7 4 8,47 0 0 0 8 33 0,40 0 0 0 8 4 6, 0 0 0 5 6 48 0,40 0 9 4 0,67 5 4 5 5 9,60 0 0-0 4 5,63 0 3 4 3 38 0,50 0 0 3,70 9 6 4 8 0,0 0 0-4 3,74 7 6 5 4 5 3 5,0 0 0-3 4 5,7 0 0 39 3 39 8,30 0 0 99 99 0 4 4,8 7 0 5 6 39 0,0 0 0-5 4 3,4 8 5 5 36 7,60 0 0-6 4 5,7 0 5 9 9 36 8 33,40 7 3 3,56 35 9 4 7 3 9 6,0 0 0-8 4 9,6 3 0 7 8 45 6,80-9 4 6,9 0 0 6 3 35,0 0 0 99 99 0 0 4 6,05 4 35 45 5 8 3 5,0 3 8,05 39 0 5 4 5 4 60,90-3 3,70 9 0 4 6 53 4,0-3 4 8,8 9 5 0 4 5 49,30-4 3 0,9 4 0 40 4 3 6,80 0 0 99 99 0 5 4 8,47 0 5 8 4 5 43,90 0 0 6 4 8,63 8 0 4 3 39 9,60 0 0 99 99 0 7 3 5, 8 0 0 3 4 4 4,80 0 0 99 99 0 8 4 8,09 6 5 35 3 7 3 5,60 9 4 9,3 0 0 0 3 0 4 5,30 0 0 99 99 0 30 3 4,07 45 0 35 3 3 3 6,30 0 0 99 99 0 3 4 0,8 0 0 5 6 4 4 3,00 0 0 99 99 0 3 4 0,8 0 0 9 4 8,50 0 0 99 99 0 33 4 0,8 0 0 4 4 3,80 0 0 99 99 0 34 4 0,8 0 0 9 4 8,80 0 0 99 99 0 35 4,08 0 0 0 5 3 4 5,0 0 0 0 36 4,08 0 0 0 5 4 6,0 0 0 99 99 0 37 4 8,84 5 9 40 3 4,00 0 0 99 99 0 38 4 4,8 0 4 7 4 7,0 0 0 99 99 0 39 4 3,89 8 9 4 4,30 0 0 0-40 4 5,49 0 0 7 0 0 4 4,90 0 0 99 99 0 4 4 9,4 0 0 6 4 6,30 0 0 99 99 0 4 4,76 4 3 0 7 4 4,40 0 0 99 99 0 43 4,94 4 0 0 9 4 9,30 0 0 99 99 0 44 4 6,6 3 4 5 6 3 4 8,00 0 0 99 99 0 45 0,8 3 4 4 0 6 4 5,0 0 0 99 99 0 46 4 9,7 3 3 0 0 9 4 4 5,60 0 0 99 99 0 47 4 6,5 3 5 7 7 4 4 3,00 0 0 99 99 0 48 4 6,5 3 0 7 5 6 30,50 0 99 99 0 49 4 3,48 3 4 0 4 0 4 4,90 0 0 99 99 0 50 4,76 3 0 4 5 3 4,0 0 0 99 99 0 5 4,03 3 6 0 0 5 5 4 6,0 0 0 99 99 0 5 4 7,04 4 0 8 0 3 4 5,0 0 0 99 99 0 53 4,6 4 5 0 0 3 3 4 5,0 0 0 99 99 0 54 4,64 5 8 0 44 9 4 4,90 0 0 99 99 0 55 6,56 5 8 0 6 5 65 3,60 0 99 99 0 56 4,0 5 3 0 3 3 39 3,30 0 0-57 4,03 5 5 0 5 3 4 9,30 0 0 99 99 0 58 4 0,4 5 9 0 5 4 0,0 0 0 99 99 0 59 4 6,00 5 0 5 0 4 0,0 0 0 99 99 0 60 4 3,4 6 0 0 4 7 0,50 0 0 99 99 0 6 5,63 7 0 0 35 54 9 4 5,0 0 0 99 99 0 6 9,7 7 6 0 0 4 4,80 0 0 - - 63 5,6 8 7 0 35 40 4,0 0 0 99 99 0 64,0 8 9 9 30 4 8 3,50 0 0-65 3,00 8 7 6 8 3 65 0,80 0 0 99 99 0 66 4 5,5 8 4 5 3 8 4 7,80 0 0 99 99 0 67 4 3,80 8 7 5 3 9 3 6,80 0 0-68 4,67 9 6 3 68 64 9 4,70 0 0 - - 69 4 9,05 9 9 6 9 7 9 4,40 0 0 99 99 0 70 8,76 0 3 9 39 47 9 4 4,70 0 0 99 99 0

3 3 4 5 6 7 8 9 0 3 4 5 6 Idenifikáor ( S ) po d ( Χ, s ) X 3 i X i X X i ( S ) i X 3 i i 3 3 X d (, s ) o( ( ) Χ 3 ) o,s ( ) s 3 X X 3 X i s( 3 ) s( ) X 3 i X 7 4 9,56 0 4 9 9 4 9 4 4,70 0 0 99 99 0 7 4 5,33 0 6 4 7 7 4 4,0 0 0 99 99 0 73 4 5,33 0 0 9 8 7 4 5,80 0 0 99 99 0 74 8,8 5 6 39 7 7 3 5,40 0 0 99 99 0 75 4 0,4 6 9 6 4 4 7,0 0 0 99 99 0 76 4 6,3 4 4 5 6 4 0,50 0 0 99 99 0 77 5,6 0 5 7 5 4 8,00 0 0 - - 78 6,55 8 6 4 0 6 4 5,0 0 0 - - 79 4 0,07 9 8 6 6 4 6,60 0 0 99 99 0 80 4 7,3 0 4 0 4 4 4,60 0 0 99 99 0 8 6,93 3 6 54 33 5 4 9,40 0 0 99 99 0 8 3,5 3 6 9 35 36 7,00 0 0-83 3,37 4 8 5 43 76 4 4,40 0 0 99 99 0 84 4,07 4 8 4 3 7 5 4 6,00 0 0 - - 85,30 5 7 8 9 0 5 4 3,80 0 99 99 0 86, 7 30 3 39 56 3 3 3,80 0 0 99 99 0 87 9,56 8 0 9 5 3 3 6,30 0 0 99 99 0 88 0,03 0 4 0 3 7 3 4 9,60 0 0 - - 89 3,89 0 30 30 0 4 5 3,30 0 0 99 99 0 90 3,74 5 0 34 3 0,00 0 0 99 99 0 9 9,87 6 8 49 47 3 4,30 0 99 99 0 9 3 9,09 4 3 0 3,50 0 0 - - 93 8,75 5 7 73 5 3 5,0 - - 94 8,0 6 5 9 6 38 0 3 4,0 - - 95,83 8 6 4 57 7 4 0,00 0 0 - - 96 5,7 35 0 0 54 57 4,0 0 0 99 99 0 97,79 38 6 5 45 53 0 4,00 0 0 99 99 0 98 4,0 39 0 44 4 0 4,00 0 0 - - 99 8,6 45 44 38 7 9,60 0 0 - - 00 9, 49 7 5 54 75 95 47,0-0.... 8.. 4 3,40 0 0 99 99 0 0.... 4.. 49 9,70 0 99 99 0 03.... 9.. 8,50 0 0 99 99 0 04.... 4.. 46 6,90 0 99 99 0 05.... 6.. 38 8,70 0 0 99 99 0 06.. 7 8 9 0 3 4 5 6 7 8 9 30 Idenifikáor ( S ) přesuny ( S ) 3 ( S ) kon kon X i X kon 3 kon X X i X 3 ( ) i i X o d( Χ, ) s (, kon 3 d Χ s ) i i d ( Χ, ) X 3 3 s 0,60.,0 4 0 0 9 9 43 8,60. 5,5. 6,00 5 0 5 30 6,00. 3 7,7. 7,60 6 0 4 4 33 7,60. 4 9,7. 0,30 0 0 7 7 7 0,30. 5 3,35 6 6 3,00 0 0 0 0 0 8 6 8,60. 6 3 7,79. 3 7,80 3 3 4 4 39 8,50. 7 5,3. 5,80 0 0 0 33 33 33 5,80. 8 3,35. 3,00 0 0 48 48 48 3,00. 9 0,84.,40 4 5 5 5,40. 0 3,0.,80 0 4 4 8 8 4 5,0. 4,56 6 6 0,00 8 3 3 3 4 3,40. 4,5. 5,00 4 4 5 30 30 3 5,00. 3 3 6,4 4 4 8,00......... 4 3,5. 3,00 5 5 39 39 3,00. 5 0,58. - 5 5 36 36 -. 6 5,68. 6,00 0 4 9 83 85,00. 7 6,54. 7,0 0 0 4 7 3 9 7,0. 8 9,88. 9,50 8 6 7 53 45 9,50. 9 4,73. 5,0 6 0 6 4 4 7,0. 0 4 9,9. 4 9,90 5.. 5..... 8,4. 7,70 6 8 7 4 3 5,70. 7,7. 7,30 8 4 53 53 7,80 3 4,9. 3,90 3 0 4 49 49 3,90. 4 3 0,53. 3 0,40 5 5 5 4 4 37,00. 5 8,9. 7,60 4 9 8 4 4 37 3,0. 6 9,94. 9,50 3 3 5 39 6,70. 7 6,50. 6 5,00 7 0 3 6 4 6 9,0. 8 4 3,59. 4 3,0 0.. 3..... 9 6 0,00. 6 5,0 4 6 5 3 5 3 6 0,0. 30 4 9,9. 4 9,50 5 7 7 3 8 38,0.

3 3 6 6,78. 6 3,00 7 9 0 8 6 8,0. 3 6 3,64. 6 8,50 7 3 4 6 8,0. 33 6,05. 6 4,00 4 4 5 7 5 6 4,00. 34 6 4,6. 6 8,90 5 7 6 4 6,00. 35 6 9,76. 6 5,40 6 6 8 6 6 7,80. 36 6 8,07. 6 6,40 5 9 6 9 6 8,0. 37 6 7,74. 6,00 9 3 0 9 8 6 6 7,0. 38 6 5,85. 6 7,0 7 4 4 0 6 7,0. 39 6,87. 6 4,50 6 3 4 6,0. 40 6,39. 6 5,0 7 0 7 5 3 6 0,00. 4 6 6,68. 6 6,40 4 5 6 0 9 6 8,0. 4 6 4,06. 6 4,50 5 8 0 6 3,0. 43 6 4,9. 6 9,40 4 0 4 6 6,0. 44 6 7,67. 6 8,0 7 5 5 5 4 5 9,00. 45 6 5,6. 6 5,0 8 3 8 0 6 9,0. 46 6 8,90. 6 5,80 0 9 7 6 7,0. 47 6 6,78. 6 3,00 8 0 0 7 9 7 6 7,80. 48 3 0,0. 3 0,40 9 6 7 43 37 6,0. 49 6 0,6. 6 5,0 8 4 7 5 6 8,50. 50 6 8,05. 6,0 5 8 9 8 6 6 6,40. 5 6 8,07. 6 6,40 5 8 0 0 8 6 6,70. 5 6 9,76. 6 5,40 0 7 8 8 6 6 7,80. 53 6 9,76. 6 5,40 0 30 0 0 9 6 9,40. 54 6 0,6. 6 5,0 6 0 6 44 8 6 6 5,0. 55 3,3. 3,50 5 4 7 6 5 35,0. 56 5,86. 5,80 8 30 0 3 7 39 5,80. 57 6 8,8. 6 9,40 6 5 6 6 4 6 7,0. 58 6 9,76. 6 0,30 5 6 5 7 5 6 6,00. 59 6 4,9. 6 0,30 5 3 6 5 4,00. 60 9,7. 0,30 0 3 4 30 3 5,40. 6 6 3,9. 6 5,40 5 35 4 6 0,80. 6 6,50. 6 5,00 6 6 4 6 9,0. 63 6 3,50. 6,0 0 35 6 4 6 6,70. 64 5 6,09. 5 6,40 0 6 9 30 8 8 6 5,00. 65 3 9,97. 3 0,00 7 8 8 57 39 4,0. 66 6,08. 6 7,60 6 5 4 6,40. 67 5 5,3. 5 5,0 5 7 5 3 0 5 7,0. 68 6,6. 6,80 4 4 68 3 5 0,0. 69 6,39. 6,0 3 7 7 9 7 5 7,30. 70 6,03. 6 4,50 5 3 3 39 5 3 6,80. 7 6,03. 6 4,50 6 3 3 9 5 3 6,80. 7 6 3,79. 6 4,0 5 5 5 6 0 5 9,80. 73 6 3,0. 6 5,70 7 5 5 4 6 9,00. 74 5 3,98. 5 3,60 5 3 3 39 5 8 5 4,0. 75 6 6,3. 6 7,0 5 7 7 9 6 3 5 7,0. 76 6 4,3 5 5 0,0 4 4 4 0 8 6 9,50. 77 6 5,00. 6 7,80 7 4 4 5 9 6,0. 78 6 4,34. 6 5,0 7 0 0 4 0 6 5,0. 79 6 4,04. 6 6,40 5 4 4 8 9 6,00. 80 6 6,30 5 5 0,00 9 3 3 0 5 4 5 7,00. 8 6 5,07. 6 9,0 7 3 3 54 3 5,0. 8,39.,00 5 6 6 9 4 36,00. 83 6 6,46 5 5 9,00 5 5 5 43 6 4 6 0,40. 84 6 5,73. 6 6,0 3 3 9 6 3,60. 85 6 6,97 5 5,50 9 9 5 5 5,40. 86 5 7,55. 5 7,0 5 39 5 3 5 9,50. 87 5 6,. 5 5,80 3 5 5 5 6 5 5,40. 88 6 7,00. 6 9,40 4 4 3 9 5 5 0,00. 89 5 6,59. 5 6,0 9 7 7 0 5 5 5 3,0. 90 5,95. 5,80 9 6 6 6 5 6,70. 9 5 5,8. 5 6,30 8 8 8 49 7 3 5 6,0. 9 5 3,4. 5 3,60 8 8 4 5 4,50. 93 5 6,77. 5 7,30 9 9 73 5 5,40. 94 5 5,95. 5 6,40 9 9 9 6 0 0 5 6,40. 95 6 9,63. 6 0,00 5 8 8 57 6 4 6 7,60. 96 6 30,70. 6,0 6 54 8 6 6 7,80. 97 6 30,43. 6,00 5 6 6 45 5 8,0. 98 6 3,64. 6,0 5 5 5 44 5 3 6 8,00. 99 9,7. 9,80 6 44 3 7 9,80. 00 8,4. 5,40 6 7 7 54 93 9 6,70. 0 4,39. 3,90 7 5 5. 3 4,0. 0 3,5. 3,00 4 4 4. 49 49 3,00. 03 8,65. 8,90 8 5 5. 8 8 8,00. 04 0,5. 0,00 4 4 4. 47 48,00. 05,8.,0 7 6 6. 5 38,0. 06 39 39. 9 4,40.

33.5 DEFINICE NEURONOVÉ SÍTĚ PRO PŘEDPOVĚĎ INDEXU ODCHODU (sr.96 ) Proměnné použié v neuronové síi disponibilia úvěrovéo limiu přesa úvěrovéo limiu poče ransakí šeky měsí_ poče ransakí šeky měsí_ poče ransakí šeky měsí_3 poče vkladů na běžný úče měsí_ poče vkladů na běžný úče měsí_ poče vkladů na běžný úče měsí_3 poče auomaiký plaeb z běžnéo úču měsí_ poče auomaiký plaeb z běžnéo úču měsí_ poče auomaiký plaeb z běžnéo úču měsí_3 reklamae měsí_ reklamae měsí_ reklamae měsí_3 reklamae měsí_4 reklamae měsí_5 podíl salda měsíe a měsíe podíl salda měsíe a měsíe 3 podíl salda měsíe 3 a měsíe 4 podíl salda měsíe 4 a měsíe 5

34.6 DATA REÁLNÉHO PŘÍPADU (sr. 97) Sledovaní klieni Bi, mikropodnikaelé zemědělskéo sekoru, se svým idenifikáorem a ru, zařazením do původní sluků, Eukleidovou vzdálenosí každéo objeku k původnímu příslušnému sluku a s odnoami původní proměnný po všena sledovaná období čyř yklů jsou uvedeny na CD přiloženému k diserační prái (je umísěné na deská na koni práe).