Kohonenova samoorganizující mapa a její aplikace v marketingu
|
|
- Klára Kučerová
- před 7 lety
- Počet zobrazení:
Transkript
1 Kohoeova samoorgazuící mapa a eí aplace v maretgu Mgr. Ig. Davd Vít, vtdav1@fel.cvut.cz Alteratvou lascých metod shluové aalýzy sou bologcy sprovaé algortmy, zeméa metody založeé a umělých euroových sítích. Z velé abídy dosud popsaých modelů umělých euroových sítí e třeba se zaměřt a ty z metod, teré sou obecě vhodé pro exploračí aalýzu dat. Záladí model umělé euroové sítě vhodé pro využtí ve shluové aalýze představuí Kohoeovy samoorgazuící mapy (selforgazg map), patřící mez modely euroové sítě s učeím bez učtele. Svým chováí přpomíaí lascou optmalzačí metodu -průměrů (-meas) shluové aalýzy. Cílem této práce e posoudt, zda sou výsledy shluového rozladu zísaé pomocí Kohoeovy samoorgazuící mapy porovatelé se shluovým rozladem vytvořeým pomocí metody -průměrů, a vyhodott relevac a stabltu této metody pro eí případé využtí v maretgové trží segmetac. 1. Prcp Kohoeovy samoorgazuící mapy Jde o edovrstvou umělou euroovou síť, terá umožňue vzualzovat topograf a herarchcou struturu multdmezoálích dat trasformací do prostoru žší dmeze (tzv. omprese dat). Ve výoé vrstvě exstue mříža euroů s daou topologí (obvyle hexagoálí ebo čtvercovou), počet eích vstupů odpovídá dmez vstupího počtu proměých vstupího datového souboru, váhy vstupů euroů vycházeí z předložeých vstupích obetů a přeosová fuce představue vadratcou Euldovsou vzdáleost. N Nechť x R e áhodě zvoleý datový vetor, potom Kohoeova samoorgazuící mapa realzue eleárí proec fuce p (x) hustoty pravděpodobost x do R R, de w e váha eurou s dexem. Tato proece zachovává topolog původího vícerozměrého datového souboru. Pro porováváí e použta vhodá míra vzdáleost (epodobost) D, obvyle vadratcá Euldovsá vzdáleost. Nelepším * reprezetatem daého vstupího vetoru (tzv. referečím vetorem) e euro s dexem, pro ěž platí: N D( x, w * ) m ( x w ) 1 Výstupem eurou s dexem pro vstup x e hodota D x, w ) (.. Laterálím hbcem (postraím vazbam) síť vyhodotí euro s evyšší odezvou, terý se stae referečím vetorem daého vzoru. Učeí Kohoeovy samoorgazuící mapy tedy představue uspořádáí vetorů v mřížce ta, aby reprezetovaly příslušá vstupí data. Icalzačí hodoty vah euroů w se zpravdla staovuí áhodě, během procesu učeí se váhy edotlvých euroů adaptuí podle předládaých vzorů vstupích obetů.. Prcp metody -průměrů Adaptace vah euroů mřížy e aalogí postupého výpočtu ového cetrodu u optmalzačí shluovací metody -průměrů. Na začátu této metody e zvole počet shluů, a ehož záladě e vhodým způsobem určeo počátečích cetrodů. Tyto cetrody tvoří geometrcé středy výsledých shluů. Potom se zoumaí vzdáleost aždého obetu od aždého cetrodu ta, že se spočte Euldovsá vzdáleost obetu od cetrodu, a obet e přřaze eblžšímu cetrodu. Pro aždý shlu e pa spočte ový cetrod (vetor průměrých hodot edotlvých proměých) a zovu se opaue přřazeí všech obetů do shluů určeých ově spočteým cetrody. Celý postup probíhá ta dlouho, doud dochází přesuům obetů mez cetrody. Metoda slě závsí a pořadí obetů v datovém souboru, způsobu volby výchozích cetrodů, způsobu výpočtu polohy ového cetrodu, aož a zalost počtu hledaých shluů. Jde tedy o edetermstcou metodu, terá aleze pouze loálě optmálí výslede. Metoda -průměrů pracue s vattatvím, cméě byla avržea eí modface určeá pro smíšeá data, azvaá metoda -prototypů. V metodě -prototypů e použta specálí míra epodobost, terá ombue vadratcou Euldovsou vzdáleost, použtou pro vattatví data, s mírou užívaou pro pouze ategorálí data v metodě -modů, založeé a oefcetu prostého esouhlasu. Teto oefcet e defová ao poměr počtu proměých, u chž sou u obou obetů rozdílé hodoty, a celového počtu proměých. Použeme pomocé ozačeí Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 1 (celem 9)
2 d, [ x, x, ], teré říá, že d, 1, poud x, x,, a d, 0, poud x, x,. Koefcet prostého esouhlasu e defová ao m d, D 1., m Ačolv metoda -průměrů, resp. eí modface pro smíšeá data metoda -prototypů, eposytuí globálě optmálí řešeí, sou velm vhodé pro reduc rozsáhlých datových souborů, teré eí pro ech rozsah možo zpracovat ým shluovacím metodam. Míra epodobost použtá v metodě -prototypů lze mplemetovat do modfovaé Kohoeovy samoorgazuící mapy, a tím upravt pro oretí použtí pro datové soubory obsahuící proměé smíšeých typů. Toto rozšířeí mplemetace vycházeící ze SOM_PAK bylo pod ázvem NCSOM publováo autory Cheem a Marquesem bez aalýzy eho chováí vzhledem terpretac výsledů a porováí s lascým metodam shluové aalýzy. Programový balí mplemetace NCSOM eí bohužel dostupý. 3. Použtá metoda Pro posouzeí chováí Kohoeovy samoorgazuící mapy a vyloučeí případých systematcých chyb byl použt soubor volě dostupý balí softwarových prostředů SOM_PAK 3.1 vytvořeý přímo týmem, ehož čleem byl autor metody Teuvo Kohoe. Ja ž bylo uvedeo, záladím edostatem této metody pro eí přímé využtí ve shluové aalýze e eí omezeí a vattatví data vtřě využtá metra e založea a vadratcé Euldovsé vzdáleost. V případě, dy se ovšem použe datový soubor omezeý pouze a vattatví data, lze bez problému srovávat shluy vytvořeé pomocí Kohoeovy samoorgazuící mapy se shluy vytvořeým pomocí vhodě mplemetovaé metody -průměrů. Poud by se uázalo, že výsledy zísaé a vattatvích datech pomocí euroové sítě odpovídaí výsledům zísaým metodou -průměrů, bylo by možo algortmus Kohoeovy samoorgazuící mapy modfovat pro aplac metry užívaé v metodě -prototypů, a ta zobect teto model euroové sítě pro prác se smíšeým daty obsažeým ve výstupích datech maretgových dotazíů a ásledě plohodotě aplovat ao alteratví metodu hledáí modelu tržích segmetů. Jao vhodý datový soubor byl použt vzorový soubor car_sales.sav, dodávaý s produtem IBM SPSS v19, terý obsahue vattatví techcé parametry 157 osobích automoblů včetě eúplých obetů. Soubor obsahue data, terá obsahuí přrozeé shluy podle růzých techcých parametrů, proto e vhodý pro uvažovaé využtí ao testovací referečí soubor. Teto soubor byl pomocí produtu IBM SPSS v19 aalyzová s využtím mplemetovaé shluovací metody -průměrů s ohledem a počet shluů, terý orespodue požadavům ladeým a shluy, představuící modely tržích segmetů. V rámc testů byl z datového souboru vyřaze ede odlehlý obet, terý zresloval chováí metody -meas. Pro hledáí shluů byly využty ásleduící proměé původího souboru: cea, obem motoru, výo, rozvor, déla, šířa, pohotovostí hmotost, obem ádrže, spotřeba. Aby byly použté výsledy oretí, byla použta data po provedeí z-scores ormalzace edotlvých proměých. Zvoleá moža proměých by zasluhovala předchozí provedeí fatorové aalýzy, eboť u ěterých proměých exstue pravděpodobá závslost. Ncméě pro účely tohoto porováí to eí ezbyté, elož možá závslost ěterých proměých má vlv a terpretac zísaých shluových rozladů, olv a chováí zvoleých metod. Po provedeí růzých shluových rozladů pomocí -meas byl použtý datový soubor trasformová do datového formátu vstupího souboru programového balíu SOM_PAK a provedey ásledá opaovaá tréováí Kohoeovy samoorgazuící mapy. Výsledá data pro vzualzac atréovaé Kohoeovy samoorgazuící mapy byla pomocí utlty apsaé v programovacím azyce Java trasformováa do sado terpretovatelé podoby, obsahuící sezamy obetů v edotlvých alezeých shlucích spolu s formací o obetu, terý e eho reprezetatem, a evětší odchylce obetu zařazeého do tohoto shluu. Tato zísaá data sou vhodým podladem pro porováí chováí metody -průměrů a Kohoeovy samoorgazuící mapy. 4. Zpracováí uázových dat Př zpracováí datového souboru byl lade důraz a požadavy ladeé a trží segmet, tedy dostatečou defovatelost, velost, rozlštelost, přístupost a měřtelost. Tyto požadavy mpluí vymezeí možého počtu shluů tvořících shluový rozlad a maxmálí počet mez až 10 cílovým shluy dostatečé velost, přčemž za hrac dostatečé velost e možo brát shluy obsahuící více ež 10% obetů. Optmálí počet alezeých shluů a záladě předchozích emprcých testů by se měl pohybovat zhruba mez 3 až 6, poud maí představovat model tržích segmetů daého cílového trhu. Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa (celem 9)
3 4.1. Metoda -průměrů Pomocí IBM SPSS v19 byly provedey opaovaé shluové rozlady pomocí metody -průměrů s vadratcou Euldovsou vzdáleostí pro až 10 shluů. Metoda posytue pro daý datový soubor stablí výsledy př případém ém uspořádáí vstupích hodot př růzých astaveích a omezeí počtu terací algortmu. Z hledsa posouzeí homogeost výsledů vzhledem terpretac zísaých shluů představuí optmálí rozlad varaty se 4, 5 a 6 cílovým shluy. Shluové rozlady obsahuí ásleduící počty obetů: rozlad a 6 shluů: 54, 50, 15, 14, 11 a 7 obetů, rozlad a 5 shluů: 54, 47, 4, 14 a 1 obetů, rozlad a 4 shluy: 58, 49, 4 a 0 obetů. Vzhledem e zmňovaým požadavům ladeým a trží segmety byl zvole shluový rozlad a 4 shluy, terý obsahue ásleduící obety vstupího datového souboru: [A4] 5, 8, 9, 1, 9, 30, 3, 37, 38, 47, 48, 58, 59, 64, 67, 68, 80, 81, 83, 85, 86, 87, 9, 96, 97, 98, 10, 108, 110, 115, 118, 119, 14, 15, 16, 17, 18, 13, 133, 134, 135, 137, 140, 143, 147, 151, 15, 153, 154 [B4], 4, 6, 10, 11, 1, 13, 14, 18,, 3, 4, 8, 31, 33, 35, 43, 45, 49, 51, 5, 53, 55, 60, 61, 65, 66, 69, 70, 71, 7, 75, 8, 84, 88, 89, 90, 91, 93, 100, 103, 104, 105, 106, 107, 111, 11, 113, 116, 117, 10, 11, 1, 13, 138, 141, 155, 156 [C4] 1, 0, 6, 7, 36, 46, 50, 57, 6, 63, 79, 101, 114, 19, 130, 131, 136, 139, 14, 145, 146, 148, 149, 150 [D4] 7, 15, 17, 19, 5, 40, 41, 4, 44, 54, 56, 73, 74, 76, 77, 78, 94, 95, 99, 144. Zísaý shluový rozlad bude posuzová vzhledem výpočtům Kohoeovy samoorgazuící mapy. Chováí metody -průměrů e velm příemé v tom, že lze předem staovt počet hledaých shluů ta, aby odpovídal očeávaé strutuře datového souboru, a a záladě terpretace výsledů zvolt optmálí rozlad. Iterace algortmu mplemetovaého v IBM SPSS v19 sou uočey v době do edé muty. Pro další dodatečé srováí byl zvole shluový rozlad a 6 shluů, terý obsahue ásleduící obety datového souboru: [A6] 1, 5, 8, 9, 0, 1, 9, 30, 3, 36, 37, 38, 48, 58, 59, 63, 64, 67, 80, 81, 86, 87, 9, 96, 97, 10, 108, 110, 114, 115, 118, 119, 18, 13, 133, 134, 135, 137, 140, 143, 145, 146, 147, 148, 149, 150, 151, 15, 153, 154 [B6], 4, 6, 10, 11, 1, 13, 14, 18,, 3, 4, 8, 31, 33, 35, 45, 47, 49, 5, 55, 60, 65, 66, 68, 69, 70, 71, 75, 8, 83, 84, 85, 88, 90, 91, 93, 98, 100, 103, 104, 105, 106, 107, 11, 116, 10, 11, 1, 17, 138, 141, 155, 156 [C6] 40, 41, 4, 43, 51, 53, 56, 61, 89, 113, 13 [D6] 7, 15, 17, 19, 44, 54, 73, 74, 76, 77, 78, 94, 99, 111, 144 [E6] 6, 7, 46, 50, 57, 6, 79, 101, 19, 130, 131, 136, 139, 14 [F6] 5, 7, 95, 117, 14, 15, Kohoeova samoorgazuící mapa Vzhledem vlastostem této umělé euroové sítě sou shluy ve vstupím datovém souboru reprezetováy edotlvým euroy mapy. Všechy obety datového souboru, echž referečí vetor e steý, patří do do steého shluu. Kohoeova mapa tedy fatorzue vstupí datový soubor a třídy evvalece dle referečích vetorů. V rámc programového balíu SOM_PAK 3.1 byly otestováy růzé varaty astaveí parametrů, přčemž pro fálí výsledy bylo v souladu s doporučeím autorů použta hexagoálí mříža s Gaussovou fucí oolí. Pro zlepšeí chováí mapy vzhledem chybému atréováí, teré e charaterzováo tzv. přerouceím mapy, e amísto čtvercové topologe mapy doporučea topologe obdélíová. Pro calzac váhových vetorů mapy byla použta metoda áhodé calzace. Obráze 1 Sammoovo mapováí přerouceé mřížy Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 3 (celem 9)
4 4..1.Volba vhodé velost mřížy Záladím problémem pro použtí Kohoeovy samoorgazuící mapy pro výstupí data maretgového dotazováí e otáza volby velost mapy. Smysluplé výsledy pro datový soubor velost 156 obetů e možo zísat pro mapy do velost maxmálě 6x7 euroů. Poud e apřílad zvolea velost mřížy 6x7 euroů, e alezeo 4 shluů, z chž polova obsahue méě ež 4 obety a pouze edý s velostí 13 e větší ež 10 obetů. Velost zísaých shluů sou ásleduící: 1,1,1,1,1,1,1,1,1,1,,,,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,6,6,7,8,8,13. Z podoby shluového rozladu e zřemé, že eí relevatí vzhledem požadavům a ě ladeým. Mříža 5x6 euroů pa posytue ásleduící shluový rozlad sládaící se ze 30 shluů ásleduících velostí: 1,1,1,,,,,, 3,3,3,3,4,5,5,5,6,6,6,6,7,7,7,7,8,8,9,9,11,14. U mřížy 4x5 euroů e zísá teto shluový rozlad sládaící se ze 30 shluů ásleduících velostí: 1,1,3,3,4,6,6,6,6,7,7,7,8,9,9,10,10,13,15,4. Dvaáct shluů zísaých tréováí mapy o velost mřížy 3x4 euroy má potom ásleduící velost: 4,7,7,9,9,9,13,13,14,16,6,8. Využtelé výsledy bylo možo zísat až př použtí malých mříže o velostech x3 a x euroy. V případě mapy o velost x3 euroy bohužel docházelo př eím tréováí a použtém vstupím datovém souboru častému přerouceí mapy, zhruba 60% pousů o atréováí mapy sočlo touto chybou. V případě, dy edošlo př tréováí přerouceí mapy, byly opaovaé výsledé shluové rozlady pro tutéž velost mřížy detcé. U aždého shluu e a oc uvede eho referečí vetor včetě eho (x, y) souřadc v mapě. U obdélíové mřížy velost x3 bylo alezeo 6 shluů o velostech: 8,10,14,0,50,53 obetů. Jedotlvé shluy obsahuí ásleduící obety: [Ax3] 1, 5, 8, 0, 6, 7, 3, 36, 37, 46, 48, 50, 57, 58, 59, 6, 63, 67, 79, 80, 81, 86, 87, 9, 96, 97, 101, 10, 110, 114, 115, 118, 18, 19, 130, 131, 13, 133, 134, 135, 136, 137, 139, 140, 14, 145, 146, 147, 148, 149, 150, 151, 15, ref. [1 (1, 0)] [Bx3], 3, 11,, 3, 8, 49, 65, 70, 88, 103, 107, 17, 138, ref. [ (0, 1)] [Cx3] 4, 6, 7, 1, 13, 14, 15, 16, 17, 19, 5, 31, 33, 35, 39, 40, 41, 4, 43, 44, 51, 5, 53, 54, 56, 61, 66, 69, 7, 73, 74, 76, 77, 78, 84, 89, 90, 91, 93, 94, 95, 99, 100, 104, 111, 113, 1, 13, 141, 144, ref. [4 (0, )] [Dx3] 9, 47, 68, 83, 85, 98, 14, 154, ref. [9 (1, 1)] [Ex3] 10, 18, 4, 45, 60, 71, 75, 8, 105, 106, 109, 11, 116, 117, 10, 11, 15, 16, 155, 156, ref. [10 (1, )] [Fx3] 1, 9, 30, 38, 55, 64, 108, 119, 143, 153, ref. [1 (0, 0)]. Pro vzualzac zísaých výsledů abízí programový balí SOM_PAK 3.1 ásleduící možost. Grafcá vzualzace mapy uazue eí topolog se zázorěím vzdáleost referečích vetorů ve formě úroví šed čím tmavší e oblast mez dvěma euroy mřížy, tím e ech vzdáleost větší. Bohužel eí z Kohoeovy samoorgazuící mapy možo zstt vzdáleost referečích vetorů vysytuících se a oraích mapy. Vzhledem tomu, že aplace v trží segmetac vyžadue malý počet velých homogeích výsledých shluů, eposytue a tato forma vzualzace relevatí představu o vzdáleost edotlvých shluů. Obráze Vzualzace topologe atréovaé mapy velost x3 Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 4 (celem 9)
5 Vzualzace ve formě Sammoova mapováí uazue ve dvourozměrém prostoru vzáemou poměrou vzdáleost edotlvých referečích vetorů mapy odpovídaící původí Euldovsé vzdáleost ech vzorů ve vícerozměrém vstupím prostoru. Obráze 3 Sammoova proece atréovaé mapy velost x3 U čtvercové mřížy velost x euroů bylo zísáy 4 shluy o velostech 14,17,59,65 obetů, echž podoba e ásleduící: [Ax] 1, 5, 8, 9, 0, 1, 6, 7, 9, 30, 3, 36, 37, 38, 46, 48, 50, 57, 58, 59, 6, 63, 64, 67, 79, 80, 81, 86, 87, 9, 96, 97, 101, 10, 108, 110, 114, 115, 118, 119, 14, 18, 19, 130, 131, 13, 133, 134, 135, 136, 137, 139, 140, 14, 143, 145, 146, 147, 148, 149, 150, 151, 15, 153, 154, ref. [1 (1, 1)] [Bx], 3, 11,, 3, 4, 8, 45, 49, 55, 65, 88, 103, 107, 116, 10, 138, ref. [ (0, 1)] [Cx] 4, 6, 7, 1, 13, 14, 15, 16, 17, 18, 19, 5, 31, 33, 35, 39, 40, 41, 4, 43, 44, 51, 5, 53, 54, 56, 60, 61, 66, 69, 71, 7, 73, 74, 76, 77, 78, 8, 84, 89, 90, 91, 93, 94, 95, 99, 100, 104, 105, 109, 111, 11, 113, 11, 1, 13, 141, 144, 156, ref. [4 (0, 0)] [Dx] 10, 47, 68, 70, 75, 83, 85, 98, 106, 117, 15, 16, 17, 155, ref. [10 (1, 0)]. Zísaá vzualzovaá mříža vypadá ásledově, e vdět, že v rámc edotlvých shluů e mez obety velá vzdáleost. Obráze 4 Vzualzace topologe atréovaé mapy velost x Sammoovo mapováí pro tato atréovaou Kohoeovu samoorgazuící mapu vypadá ásledově. Obráze 5 Sammoovo mapováí atréovaé mapy velost x Pro porováí výsledů budou použty shluové rozlady pro velost mřížy x a x3, eboť počty a velost zísaých shluů v těchto případech orespoduí s požadavy ladeým a velost a počet hledaých shluů. Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 5 (celem 9)
6 5. Porováí výsledů metod Pro srováí chováí lascé optmalzačí shluovací metody -průměrů a Kohoeovy samoorgazuící mapy vydeme z předpoladu, že shluové rozlady použtého vstupího datového souboru, vytvořeé lascou metodou v ástro IBM SPSS v19, vzhledem terpretovatelost vzlých shluových rozladů dobře charaterzuí vstupí datový soubor vzhledem e specfcým požadavům ladeým a detfovaé shluy př aplac v trží segmetac. Výsledy zísaé v rámc aplace programového balíu SOM_PAK posoudíme z hledsa hypotézy ezávslost a shluovém rozladu pomocí metody -průměrů. Na záladě výsledů obou metod pro rozlady a 4 a a 6 shluů vytvoříme ombačí tabulu, de v řádcích budou uvedey shluy dle edé metody a ve sloupcích uvedey shluy dle druhé. V polích ombačí tabuly pa budou uvedey počty obetů vstupího datového souboru, teré byly přřazey do daé ombace shluů dle obou algortmů odpovídaící daému pol tabuly. Nezávslost v ombačí tabulce bude otestováa pomocí - testu ezávslost v ombačí tabulce. Nulovou hypotézu o ezávslost v ombačí tabulce dle tohoto testu zamíteme, poud pro hodotu testového rtéra s r 1 1. r. r. r. r platí, že e větší ež rtcá hodota velčy pro stupeň volost f ( r 1).( s 1 ), de r e počet ategorí u řádové proměé a s e počet ategorí u sloupcové proměé. Hodota začí počet obetů ve statstcém souboru, hodota ozačue počet obetů dle -té řádové a -té sloupcové ategore, tedy zařazeých do -tého shluu dle prví metody a do -tého shluu dle druhé metody, r e relatví četost výsytu -té řádové ategore a r e relatví četost výsytu -té sloupcové ategore. Testové rtérum ověříme a hladě výzamost 1%. Pro shluové rozlady a 6 shluů e test provádě pro 5 stupňů volost a dostatečě velém datovém souboru. Kombačí tabula pro teto případ vypadá ásledově. A6 B6 C6 D6 E6 F6 p Ax ,351 Bx ,086 Cx ,19 Dx ,15 Ex ,16 Fx , p 0,331 0,358 0,073 0,099 0,093 0,046 Tabula 1 Kombačí tabula pro shluové rozlady se 6 shluy Pro test ezávslost shluových rozladů dle metody -průměrů a Kohoeovou samoorgazuící mapou s mřížou x3 euroy a hladě výzamost 1 % zísáváme hodotu testového rtéra t test = 74,3301, tato hodota e výrazě vyšší, ež rtcá hlada t (5) 44, Na hladě výzamost 1 % tedy rt vyvracíme ulovou hypotézu a tím proazueme závslost shluového rozladu pomocí obou metod. Př blžším pohledu do ombačí tabuly e zřemé, že byl aleze ede velý společý shlu s 39 obety tvořeý shluy A6 a Ax3. Shlu E6 e z hledsa Kohoeovy samoorgazuící mapy odtržeou částí shluu A6. Jedý další výzaměší shlu společý pro oba rozlady e tvoře průem shluů D6 a Dx3. Pro shluové rozlady a 4 shluy e test provádě pro 9 stupňů volost a dostatečě velém datovém souboru. Kombačí tabula pro teto případ vypadá ásledově. Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 6 (celem 9)
7 A4 B4 C4 D4 p Ax ,430 Bx ,106 Cx ,371 Dx , p 0,35 0,384 0,159 0,13 Tabula Kombačí tabula pro shluové rozlady se 4 shluy Pro test ezávslost shluových rozladů dle metody -průměrů a Kohoeovou samoorgazuící mapou s mřížou x euroy a hladě výzamost 1 % zísáváme hodotu testového rtéra t test = 161,0666, tato hodota e výrazě vyšší, ež rtcá hlada t (9) 1, Na hladě výzamost 1 % tedy rt vyvracíme ulovou hypotézu a tím proazueme závslost shluového rozladu pomocí obou metod. Velým společým shluem se 41 obety e prů shluů A4 a Ax. Shlu Cx porývá celý shlu D4 a zhruba dvě třety shluu B4. Rozdíly mez shluovým rozlady dle obou metod vycházeí eda ze způsobu určeí středu shluu, dy metoda -průměrů počítá cetrod daého shluu, dežto v případě tréováí Kohoeovy samoorgazuící mapy e referečí vetor reprezetová edím orétím vstupím vetorem dle mplemetovaé stratege vítěz bere vše. Dalším fatorem ovlvňuícím rozdílost výsledů obou metod e chováí fuce oolí eurou, terá e použta v algortmu tréováí Kohoeovy samoorgazuící mapy. 6. Zhodoceí Aplace umělých euroových sítí představuí velm atratví oblast výzumu v moha oborech včetě exploračí aalýzy dat. Poud e exploračí aalýza dat použta v orétí problémové oblast, ao e v tomto čláu maretgová trží segmetace, musí být v úvahu bráo chováí edotlvých metod, charater a podmíy ladeé a hledaé shluy, aby ech ásledá terpretace sutečě vyadřovala hledaé vztahy a souvslost mez reálým obety. Shluová aalýza e prostředem pro vytvořeí taového zedodušeého modelu reálého světa, terý umoží efetví využtí matematcých metod pro alezeí modelu eho strutury, eíž zpětá proece a obety reálého světa umoží popsat rověž eho struturu. Obecě platí, že aždá metoda exploratví aalýzy vrátí určté výsledy a úlohou výzumía e posoudt ech relevac vzhledem problémové oblast. Kohoeova samoorgazuící mapa abízí velm zaímavý aparát pro aalýzu ezámého vstupího datového souboru, přčemž v lteratuře zmňovaé aplace a ategorzac webových zdroů sou pro tuto shluovací metodu vhodé, eboť e hledá předem edefovaý větší počet shluů. V případě použtí pro trží segmetac exstue velm strtí omezeí a maxmálí počet hledaých shluů, esmí ít o více ež 10 shluů. V případě, dy se použe Kohoeova samoorgazuící mapa s větším počtem euroů ež e počet očeávaých shluů, eí možo trasformovaá data dále agregovat do mešího počtu shluů. Zísáme sce trasformovaý dvorozměrý obraz vícedmezoálího vstupího souboru, ale ztrácíme formace o eho strutuře. Z tohoto hledsa posytue tato umělá euroová síť mohem meší možství formací ež př využtí lascých herarchcých shluovacích metod typu AGNES č MONA. Sammoovo mapováí vzualzue Euldovsou vzdáleost mez vzory referečích vetorů mřížy mapy, cméě eí zřemé, a tyto shluy vypadaí a a se sobě blíží. Pro edotlvé obety e sce dspozc hodota chyby vzhledem referečímu vetoru, ale elze zstt, aá e tato chyba vzhledem referečím vetorům sousedích shluů, resp. obetům sousedích shluů. Referečí vetory př tréováí mapy větších rozměrů maí avíc tedec rozmsťovat se po ora mapy. Ja bylo zmíěo, pro využtí v trží segmetac se podle dosavadích emprcých testů evhodě chovaí herarchcé shluovací metody, teré posytou úplou zalost strutury vstupího datového souboru. Na záladě aalýzy této strutury lze pomocí růzých rtérí rozhodout o optmálím shluovém rozladu, terý Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 7 (celem 9)
8 elépe reprezetue závslost př současém respetováí požadavů ladeých a efetví trží segmety. Nevýhodou herarchcých metod e pa utost vytvořeí a práce s matcí epodobostí edotlvých obetů. Z tohoto důvodu lze tyto metody používat pouze pro datové soubory omezeé velost. Pro zpracováí velých datových souborů e vhodá dvouroová shluová aalýza, dy v prví fáz e výrazým způsobem zmešea velost datového souboru ěterou výpočetě eáročou optmalzačí metodou, a teprve ve druhé fáz e provedeo vlastí herarchcé shluováí, teré detfue cílové shluy, teré sou modelem tržích segmetů. Jao velm vhodou metodu prvího rou dvouroové shluové aalýzy lze využít zmňovaou optmalzačí metodu -prototypů, dy se zreduue velost původího datového souboru a ový datový soubor obsahuící o ede č více řádů méě obetů, teré představuí cetrody shluů zísaých ao výslede v prvím rou použté metody -prototypů. Srová-l se cetrod s referečím vetorem, e zřemé, že cetrod podle zvoleé metody výpočtu mohem lépe vysthue polohu shluu vzhledem oolím shluům. Sce by bylo možo reduovat velost původího datového souboru pomocí Kohoeovy samoorgazuící mapy větší dmeze a potom v dalším rou dvouroové shluové aalýzy pracovat pouze se vzory referečích vetorů, cméě vzor referečího vetoru ao reprezetata shluu e méě přesý ež cetrod určeý pomocí lascé optmalzačí metody - průměrů, resp. -prototypů. Tato systematcá chyba evíce ovlvla rozdílost shluů vytvořeých pomocí metody -průměrů a Kohoeovy samoorgazuící mapy. Metoda -prototypů e závslá a volbě hodoty edé emprcé ostaty v průběhu terací, podobě ao metoda -průměrů eí determstcá, eboť závsí a pořadí obetů ve vstupím datovém souboru, cméě eí mplemetace v IBM SPSS v19 se chová z hledsa alezeí shluového rozladu velm stablě. Naprot tomu Kohoeova samoorgazuící mapa závsí a volbě topologe mřížy, tvaru oolí, velost mřížy, požadovaému učícímu rou, způsobu calzace vstupích vetorů a počtu terací. Ačolv bylo dosažeo shodých výsledů př opaovaých pousech, u ěterých tvarů mřížy a počtů terací docházelo e zmíěému přerouceí mřížy, teré vyžadovalo opaovaé tréováí mapy. Nevětší vlv a proces tréováí mapy má úvodí calzace vetorů mřížy, terá vychází z áhodého astaveí a e zcela edetermstcá. Z tohoto hledsa se v případě Kohoeovy samoorgazuící mapy eedá o stablí shluovací metodu. Doba tréováí Kohoeovy samoorgazuící mapy mplemetovaé v balíu SOM_PAK 3.1 byla avíc více ež řádově delší ve srováí s výpočtem metody -průměrů v produtu IBM SPSS v19, tedy z tohoto hledsa se eví méě vhodá zeméa př dílčím zpracováí větších datových souborů, pro teré e výhodé využívat optmalzačí shluovací metody typu -prototypů č -průměrů. Ačolv tedy lze Kohoeovy samoorgazuící mapy obecě využít pro shluovou aalýzu, ech vlastost esou pro aplac v trží segmetac výhodé a epřáší žádá poztví vylepšeí oprot lascým shluovacím metodám. Lze tedy závěrem říc, že v stuac, dy exstue specfcý algortmus pro řešeí orétího problému, tato umělá euroová síť eposytue vhoděší výpočetí aparát. Př hledáí velého počtu shluů ve velých vstupích datových souborech se potom Kohoeova samoorgazuící mapa blíží chováí metody -průměrů. Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 8 (celem 9)
9 Použtá lteratura ŘEZANKOVÁ, H., HÚSEK, D., SNÁŠEL, V. Shluová aalýza dat. Praha: Professoal Publshg 007 EVERITT, B.S., LANDAU, S., LEESE, M. Cluster aalyss, 4th edto. Lodo: Arold, a member of the Hodder Headle Group 001 HEBÁK, P., HUSTOPECKÝ, J., PECÁKOVÁ, I., PRŮŠA, M., ŘEZANKOVÁ, H., SVOBODOVÁ, A., VLACH, P. Vícerozměré statstcé metody (3). Praha: Iformatorum 006 Electroc Statstcs Textboo [ole]. Tulsa: StatSoft 007. Dostupý z WWW: KOHONEN, T., HYNNINEN, J., KANGAS, J., LAAKSONEN, J. SOM_PAK The Self-Orgazg Map Program Pacage Verso 3.1 [ole]. Hels: Hels Uversty of Techology Dostupý z WWW: ZHEXUE, H. Clusterg large data sets wth mxed umerc ad categorcal values. I Lu Hogu, Motoda Hrosh, Lu Hua (eds), Proceedgs of the 1st Pacfc-Asa Koferece o Kowledge Dscovery & Data Mg. Sgapore, World Scetfc (1997) 1-34 CHEN, N., MARQUES, N.C. A Exteso of Self-Orgazg Maps to Categorcal Data [ole]. Caparca: Uversdade Nova de Lsboa. Dostupý z WWW: XU, R., WUNSCH, D.C. Clusterg. Pscataway: IEEE Press 007 PALLANT, J. SPSS Survval Maual, 3rd Edto. Madehead: Ope Uversty Press 007 DARREN, K., MALLERY, P. SPSS for Wdows Step-by-Step: A Smple Gude ad Referece, 10.0 Update (3rd Edto). Pretce Hall 000 ŠNOREK, M. Neuroové sítě a europočítače. Praha: Vydavatelství ČVUT 004 KOHONEN, T. Self-Orgazg Maps. Berl: Sprger-Verlag 1995 VÍT, D. Využtí shluové aalýzy v maretgu: master thess. Prague: CTU FEE 009 VÍT, D. Vlv maretgového dotazováí a detfac tržích segmetů. Prague: Maretg & omuace. 009, roč. XIX, č. 4, s VÍT, D. Iterpretato of moothetc ad polythetc clusterg method results for maretg questoare processg : paper draft for Acta Polytechca. Prague: CTU FEE 009. Word Documet. Upublshed. VÍT, D. Aplace ástroe PASW SPSS 18.0 Base v trží segmetac: semar thess. Prague: CTU FEE 010. Word Documet. Upublshed. Teto text vzul v rámc předmětu Neuroové sítě a europočítače (XP36NAN) Straa 9 (celem 9)
PRAVDĚPODOBNOST A STATISTIKA
SP esty dobré shody PRAVDĚPODOBNOS A SAISIKA Lbor Žá SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Chí-vadrát testem terý e založe a tříděém statstcém souboru. SP esty
Více2. Vícekriteriální a cílové programování
2. Vícerterálí a cílové programováí Úlohy vícerterálího programováí jsou úlohy, ve terých se a možě přípustých řešeí optmalzuje ěol salárích rterálích fucí. Moža přípustých řešeí je přtom defováa podobě
VíceDoc. Ing. Dagmar Blatná, CSc.
PRAVDĚPODOBNOST A STATISTIKA Doc. Ig. Dagmar Blatá, CSc. Statsta statstcé údaje o hromadých jevech čost, terá vede zísáí statstcých údajů a jejch zpracováí teore statsty - věda o stavu, vztazích a vývoj
Více2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT
2 IDENIFIKACE H-MAICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNO omáš Novotý ČESKÉ VYSOKÉ UČENÍ ECHNICKÉ V PRAZE Faulta eletrotechicá Katedra eletroeergetiy. Úvod Metody založeé a loalizaci poruch pomocí H-matic
VícePřednáška č. 2 náhodné veličiny
Předáša č. áhodé velčy Pozámy záladím pojmům z počtu pravděpodobost Pozáma 1: Př výpočtu pravděpodobost áhodého jevu dle lascé defce je uté věovat pozorost způsobu formulace vybraého jevu. V ásledující
VíceLineární regrese ( ) 2
Leárí regrese Častým úolem je staoveí vzájemé závslost dvou (č více) fzálích velč a její matematcé vjádřeí. K tomuto účelu se používají růzé regresí metod, pomocí chž hledáme vhodou fuc f (), apromující
VíceMetody zkoumání závislosti numerických proměnných
Metody zkoumáí závslost umerckých proměých závslost pevá (fukčí) změě jedoho zaku jedozačě odpovídá změa druhého zaku (podle ějakého fukčího vztahu) (matematka, fyzka... statstcká (volá) změám jedé velčy
VícePRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2
SP3 Neparametrcké testy hypotéz PRAVDĚPODOBNOST A STATISTIKA Neparametrcké testy hypotéz čast Lbor Žák SP3 Neparametrcké testy hypotéz Lbor Žák Neparametrcké testy hypotéz - úvod Neparametrcké testy statstckých
VíceRegrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n
Regrese Aproxmace metodou ejmeších čtverců v v ( ) = f x v v x x x x Je dáo bodů [x, ], =,,, předpoládáme závslost a x a chceme ajít fuc, terá vsthuje teto tred - Sažíme se proložt fuc = f x ta, ab v =
VíceOptimalizace portfolia
Optmalzace portfola ÚVOD Problémy vestováí prostředctvím ákupu ceých papírů sou klasckým tématem matematcké ekoome. Celkový výos z portfola má v době rozhodováí o vestcích povahu áhodé velčy, eíž rozložeí
Více1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků
1 Pops statstcých dat 1.1 Pops omálích a ordálích zaů K zobrazeí rozděleí hodot omálích ebo ordálích zaů lze použít tabulu ebo graf rozděleí četostí. Tuto formu zobrazeí lze dooce použít pro číselé zay,
VíceTestování statistických hypotéz
Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím
VíceNEPARAMETRICKÉ METODY
NEPARAMETRICKÉ METODY Jsou to metody, dy předmětem testu hypotézy eí tvrzeí o hodotě parametru ějaého orétího rozděleí, ale ulová hypotéza je formulováa obecěji, apř. jao shoda rozděleí ebo ezávislost
VíceDigitální učební materiál
Dgtálí učebí materál Číslo projetu CZ..07/.5.00/34.080 Název projetu Zvaltěí výuy prostředctvím ICT Číslo a ázev šabloy líčové atvty III/ Iovace a zvaltěí výuy prostředctvím ICT Příjemce podpory Gymázum,
VíceBudeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)
Předáša 7 Derivace a difereciály vyšších řádů Budeme poračovat v ahrazováí fuce f(x v oolí bodu a polyomy, tj hledat vhodé ostaty c ta, aby bylo pro malá x a f(x c 0 + c 1 (x a + c 2 (x a 2 + c 3 (x a
Více8. Zákony velkých čísel
8 Zákoy velkých čísel V této část budeme studovat velm často užívaá tvrzeí o součtech posloupost áhodých velč Nedříve budeme vyšetřovat tvrzeí azývaá souhrě ako slabé zákoy velkých čísel Veškeré úvahy
VíceCvičení 2: Rozhodovací stromy, RBF sítě, vlastní algoritmy v RapidMineru
České vysoké učeí techcké v Praze Fakulta formačích techologí Katedra teoretcké formatky Evropský socálí fod Praha & EU: Ivestujeme do vaší budoucost MI-ADM Algortmy data mgu 2010/2011 Cvčeí 2: Rozhodovací
VíceNejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A
Nejstoty měřeí Pro každé přesé měřeí potřebujeme formac s jakou přesostí bylo měřeí provedeo. Nejstota měřeí vyjadřuje terval ve kterém se achází skutečá hodota měřeé velčy s určtou pravděpodobostí. Nejstota
VíceSP2 Korelační analýza. Korelační analýza. Libor Žák
Korelačí aalýza Přpomeutí pojmů áhodá proměá áhodý vetor áhodý vetor Náhodý výběr: pro áhodou proměou : pro áhodý vetor : pro áhodý vetor : Přpomeutí pojmů - ovarace Kovarace áhodých proměých ovaračí oefcet
Více4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností
4.2 Elemetárí statstcké zpracováí Výsledkem statstckého zjšťováí (. etapa statstcké čost) jsou euspořádaá, epřehledá data. Proto 2. etapa statstcké čost zpracováí, začíá většou jejch utříděím, zpřehleděím.
Vícea další charakteristikou je četnost výběrového souboru n.
Předáška č. 8 Testováí rozptylu, testy relatví četost, testy dobré shody, test ezávslost kvaltatvích zaků Testy rozptylu Testy se používají k ověřeí hypotézy o určté velkost rozptylu a k ověřeí vztahu
VíceOdhady parametrů základního. Ing. Michal Dorda, Ph.D.
Odhady parametrů základího souboru Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt celou populac, provádíme
VíceOdhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.
Odhady parametrů základího souboru Ig. Mchal Dorda, Ph.D. Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl σ atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt
VíceTento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i
: ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru
Více3. cvičení 4ST201 - řešení
cvčící Ig. Jaa Feclová 3. cvčeí 4ST0 - řešeí Obah: Míry varablty Rozptyl Směrodatá odchyla Varačí oefcet Rozlad rozptylu a mezupovou a vtroupovou varabltu Změa rozptylu Vyoá šola eoomcá VŠE urz 4ST0 Míry
VíceStatistické charakteristiky (míry)
Stattcé charaterty (míry) - hrují formac, obažeou v datech (vyjadřují j v ocetrovaé formě); - charaterzují záladí ryy zoumaého ouboru dat; - umožňují porováváí více ouborů. upy tattcých charatert :. charaterty
Více, jsou naměřené a vypočtené hodnoty závisle
Měřeí závslostí. Průběh závslost spojtá křvka s jedoduchou rovcí ( jedoduchým průběhem), s malým počtem parametrů, která v rozmezí aměřeých hodot vsthuje průběh závslost, určeí kokrétího tpu křvk (přímka,
VíceTéma 1: Pravděpodobnost
ravděpodobot Téma : ravděpodobot ředáša - ravděpodobot áhodého evu Náhodý pou a áhodý ev Náhodý pou - aždá čot, eíž výlede eí edozačě urče podmíam, za terých probíhá apř hod otou, měřeí dély, běh a 00
Vícek(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln
Číselé řady - řešeé přílady ČÍSELNÉ ŘADY - řešeé přílady A. Součty řad Vzorové přílady:.. Přílad. Určete součet řady + = + 6 + +.... Řešeí: Rozladem -tého čleu řady a parciálí zlomy dostáváme + = + ) =
VíceHODNOCENÍ KVALITY SHLUKŮ
HODNOCENÍ KVALITY SHLUKŮ Haa Řezaová Vysoá šola eoomcá v Praze ttp://b.vse.cz/~rezaa Aalýza dat 008/II Obsa Prcpy metod sluové aalýzy Sluováí objetů (vetorů pozorováí) Porováváí se zámým zařazeím objetů
Více8. cvičení 4ST201-řešení
cvičící 8. cvičeí 4ST01-řešeí Obsah: Neparametricé testy Chí-vadrát test dobréshody Kotigečí tabuly Aalýza rozptylu (ANOVA) Vysoá šola eoomicá 1 VŠE urz 4ST01 Neparametricé testy Neparametricétesty využíváme,
VíceGenerování dvojrozměrných rozdělení pomocí copulí
Pravděpodobost a matematcká statstka eerováí dvojrozměrých rozděleí pomocí copulí umbelova copule PRAHA 005 Vpracoval: JAN ZÁRUBA OBSAH: CÍL PRÁCE TEORIE Metoda verzí trasformace O copulích Sklarova věta
VíceTéma 5: Analýza závislostí
Aalýza závlotí Téma 5: Aalýza závlotí Předáša 5 Závlot mez ev Záladí pom Předmětem této aptol ude zoumáí závlotí ouvlotí mez dvěma a více ev. Jedá e o proutí do vztahů mez ledovaým ev a tím přlížeí tzv.
VícePRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor
SP Náhodý vektor PRAVDĚPODOBNOS A SAISIKA Náhodý vektor SP Náhodý vektor Náhodý vektor Náhodý vektor slouží k popsu výsledku pokusu kdy měříme více údaů o procesu. Před provedeím pokusu eho výsledek a
VíceNárodní informační středisko pro podporu kvality
Národí iformačí střediso pro podporu vality Problémy s uazateli způsobilosti a výoosti v praxi Dr.Jiří Michále, CSc. Ústav teorie iformace a automatizace AVČR Uazatel způsobilosti C p Předpolady: ormálí
Více4. Strojové učení. 4.1 Základní pojmy
4. Stroové učeí 4. Základí pomy Důležtou vlastostí žvých orgasmů e schopost přzpůsobovat se měícím se podmíkám (adaptovat se), evetuálě se učt a základě vlastích zkušeostí. Schopost učt se bývá ěkdy dokoce
Více8.1.2 Vzorec pro n-tý člen
8.. Vzorec pro -tý čle Předpolady: 80 Pedagogicá pozáma: Myslím, že jde o jedu z velmi pěých hodi. Přílady a hledáí dalších čleů posloupostí a a objevováí vzorců pro -tý čle do začé míry odpovídají typicým
Více9 Kombinatorika, teorie pravděpodobnosti a matematická statistika
9 Kombatora, teore pravděpodobost a matematcá statsta Te, do argumetue průměrým platem, e s velou pravděpodobostí vysoce adprůměrý vůl s hluboce podprůměrým vzděláím (Mloslav Drucmüller) 9. Kombatora Kombatora
VíceAplikace teorie neuronových sítí
Alace teore euroových sítí Doc. RNDr. Iveta Mrázová CSc. Katedra teoretcé formaty Matematco-fyzálí faulta Uverzty Karlovy v Praze Alace teore euroových sítí Asocatvíamět a restaurace obrazu Doc. RNDr.
Více4 VÝPOČET PROVOZNÍCH A PORUCHOVÝCH STAVŮ V ES POMOCÍ PC USTÁLENÉ STAVY
4 VÝPOČET PROVOZNÍCH A PORCHOVÝCH STAVŮ V ES POMOCÍ PC STÁLENÉ STAVY Bc. Ja Veleba ZÁPADOČESKÁ NIVERZITA V PLZNI Faulta eletrotechcá Katedra eletroeergety a eologe 1. Úvod Eletrzačí soustava (ES je soubor
VícePRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor
SP Náhodý vektor PRAVDĚPODOBNOS A SAISIKA Náhodý vektor Lbor Žák SP Náhodý vektor Lbor Žák Náhodý vektor Náhodý vektor slouží k popsu výsledku pokusu kdy měříme více údaů o procesu. Před provedeím pokusu
VíceTest dobré shody se používá nejčastěji pro ověřování těchto hypotéz:
Ig. Marta Ltschmaová Statstka I., cvčeí 1 TESTOVÁNÍ NEPARAMETRICKÝCH HYPOTÉZ Dosud jsme se zabýval testováím parametrcký hypotéz, což jsou hypotézy o parametrech rozděleí (populace). Statstckým hypotézám
Více11. Časové řady. 11.1. Pojem a klasifikace časových řad
. Časové řad.. Pojem a klasfkace časových řad Specfckým statstckým dat jsou časové řad pomocí chž můžeme zkoumat damku jevů v čase. Časovou řadou (damcká řada, vývojová řada) rozumíme v čase uspořádaé
Více5. Lineární diferenciální rovnice n-tého řádu
5 3.3.8 8:44 Josef Herdla lieárí difereciálí rovice -tého řádu 5. Lieárí difereciálí rovice -tého řádu (rovice s ostatími oeficiety) ( ), a,, a (5.) ( ) ( ) y a y a y ay q L[ y] y a y a y a y, q je spojitá
VíceDLUHOPISY. Třídění z hlediska doby splatnosti
DLUHOISY - dlouhodobý obchodovatelý ceý papír - má staoveou dobu splatost - vyadřue závaze emteta oblgace (dlužía) vůč matel oblgace (věřtel) Tříděí z hledsa doby splatost - rátodobé : splatost do 1 rou
Více8.1.2 Vzorec pro n-tý člen
8 Vzorec pro -tý čle Předpolady: 80 Pedagogicá pozáma: Přílady a hledáí dalších čleů posloupostí a a objevováí vzorců pro -tý čle do začé míry odpovídají typicým příladům z IQ testů, teré studeti zají
VíceVY_52_INOVACE_J 05 01
Název a adresa školy: Středí škola průmyslová a umělecká, Opava, příspěvková orgazace, Praskova 399/8, Opava, 74601 Název operačího programu: OP Vzděláváí pro kokureceschopost, oblast podpory 1.5 Regstračí
VícePravděpodobnostní model doby setrvání ministra školství ve funkci
Pravděpodobostí model doby setrváí miistra školství ve fukci Základí statistická iferece Data Zdro: http://www.msmt.cz/miisterstvo/miistri-skolstvi-od-roku-848. Ke statistickému zpracováí byla vzata pozorováí
Více2. TEORIE PRAVDĚPODOBNOSTI
. TEORIE PRAVDĚPODOBNOSTI V prax se můžeme setat s dvojím typem procesů. Jeda jsou to procesy determstcé, u terých platí, že př dodržeí orétích vstupích podmíe obdržíme přesý, předem zámý výslede (te můžeme
VíceNepředvídané události v rámci kvantifikace rizika
Nepředvídaé událost v rác kvatfkace rzka Jří Marek, ČVUT, Stavebí fakulta {r.arek}@rsk-aageet.cz Abstrakt Z hledska úspěchu vestce ohou být krtcké právě ty zdroe ebezpečí, které esou detfkováy. Vzhlede
Více2 Diferenciální počet funkcí více reálných proměnných
- 6 - Difereciálí počet fucí více proměých Difereciálí počet fucí více reálých proměých 1 Spoitost, limity a parciálí derivace Fuce více reálých proměých Defiice Pod reálou fucí reálých proměých rozumíme
Více4. KRUHOVÁ KONVOLUCE, RYCHLÁ FOURIEROVA TRANSFORMACE (FFT) A SPEKTRÁLNÍ ANALÝZA SIGNÁLŮ
4. KRUHOVÁ KOVOLUCE, RYCHLÁ FOURIEROVA TRASFORMACE FFT A SEKTRÁLÍ AALÝZA SIGÁLŮ Kruová cylcá ovoluce Ryclá Fourerova trasformace Aplace DFT a aalogové sgály, frevečí aalýza perodcýc aalogovýc sgálů s využtím
Více1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru
Lekce Normálí rozděleí v rově V této lekc se udeme věovat měřeí korelačí závslost dvojce áhodých velč (dvousložkového áhodého vektoru) Vcházet udeme z ormálího rozděleí pravděpodoost áhodého vektoru v
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobýváí zalostí Doc. RND. Iveta Mázová CSc. Kateda teoetcé fomat Matematco-fzálí faulta Uvezt Kalov v Paze Dobýváí zalostí Předzpacováí dat Doc. RND. Iveta Mázová CSc. Kateda teoetcé fomat Matematco-fzálí
Více5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC
5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC V této kaptole se dozvíte: jak je defováa fukce přrozeá odmoca v kompleím oboru a jaké má vlastost včetě odlšostí od odmocy v reálém
VíceDISKRÉTNÍ MATEMATIKA II
Faulta pedagogcá Techcá uverzta v Lberc DISKRÉTNÍ MATEMATIKA II Doc. RNDr. Mroslav Koucý CSc. Lberec 4 Úvod Dsrétí ateata resp. její zálady patří jž tradčě ez stadardí téata předášeá a Techcé uverztě v
VíceÚvod do korelační a regresní analýzy
Úvod do korelačí a regresí aalýz Bude ás zajímat, jak těsě spolu souvsí dva sledovaé jev Příklad: vztah mez rchlostí auta a brzdou dráhou vztah mez věkem žáka a rchlostí v běhu a 60 m vztah mez spotřebou
Více9. Měření závislostí ve statistice. 9.1. Pevná a volná závislost
Dráha [m] 9. Měřeí závslostí ve statstce Měřeí závslostí ve statstce se zývá především zkoumáím vzájemé závslost statstckých zaků vícerozměrých souborů. Závslost přtom mohou být apříklad pevé, volé, jedostraé,
Více3. Charakteristiky a parametry náhodných veličin
3. Charateristiy a parametry áhodých veliči Úolem této apitoly je zavést pomocý aparát, terým budeme dále popisovat pomocí jedoduchých prostředů áhodé veličiy. Taovýmto aparátem jsou tzv. parametry ebo
Více8 NELINEÁRNÍ REGRESNÍ MODELY
8 NELINEÁRNÍ REGRESNÍ MODELY 8 Tvorba eleárího regresího modelu Postup tvorby eleárího regresího modelu se dá rozčlet do těchto kroků: Návrh regresího modelu Obvykle se jako eleárí regresí model používá
VíceIlustrativní příklad ke zkoušce z B_PS_A léto 2014.
Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95
VíceVýukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT
Základy práce s tabulkou Výukový modul III. Iovace a zkvaltěí výuky prostředctvím IC éma III..3 echcká měřeí v MS Excel Pracoví lst 5 Měřeí teploty. Ig. Jří Chobot VY_3_INOVACE_33_5 Aotace Iovace a zkvaltěí
VíceStrojové učení. Things learn when they change their behavior in a way that makes them perform better in a future. (Witten, Frank, 1999) typy učení:
Strojové učeí The feld of mache learg s cocered wth the questo of how to costruct computer programs that automatcally mprove wth eperece. (Mtchell, 1997) Thgs lear whe they chage ther behavor a way that
VíceChyby přímých měření. Úvod
Chyby přímých měřeí Úvod Př zjšťováí velkost sledovaé velčy dochází k růzým chybám, které ovlvňují celkový výsledek. V pra eestuje žádá metoda měřeí a měřcí zařízeí, které by bylo absolutě přesé, což zameá,
VíceP2: Statistické zpracování dat
P: Statistické zpracováí dat Úvodem - Statistika: věda, zabývající se shromažďováím, tříděím a ásledým popisem velkých datových souborů. - Základem statistiky je teorie pravděpodobosti, založeá a popisu
VíceSekvenční logické obvody(lso)
Sekvečí logické obvody(lso) 1. Logické sekvečí obvody, tzv. paměťové čley, jsou obvody u kterých výstupí stavy ezávisí je a okamžitých hodotách vstupích sigálů, ale jsou závislé i a předcházejících hodotách
VíceSpolehlivost a diagnostika
Spolehlvost a dagostka Složté systémy a jejch spolehlvost: Co je spolehlvost? Vlv spolehlvost kompoetů systému Návrh systému z hledska spolehlvost Aplkace - žvotě důležté systémy - vojeské aplkace Teore
Více6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.
6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola
VícePRAVDĚPODOBNOST A STATISTIKA
Matematka IV PRAVDĚPODOBNOT A TATITIKA Lbor Žák Matematka IV Lbor Žák Regresí aalýza Regresí aalýza zkoumá závslost mez ezávslým proměým X ( X,, X k a závsle proměou Y. Tato závslost se vjadřuje ve tvaru
VíceS k l á d á n í s i l
S l á d á í s i l Ú o l : Všetřovat rovováhu tří sil, působících a tuhé těleso v jedom bodě. P o t ř e b : Viz sezam v desách u úloh a pracovím stole. Obecá část: Při sládáí soustav ěolia sil působících
Více10.2.3 VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI
Středí hodoty Artmetcý průměr vážeý Aleš Drobí straa 0 VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI Zatím jsme počítal s tím, že četost ve vztahu pro vážeý artmetcý průměr byla přrozeá čísla Četost mohou
Více2 STEJNORODOST BETONU KONSTRUKCE
STEJNORODOST BETONU KONSTRUKCE Cíl kapitoly a časová áročost studia V této kapitole se sezámíte s možostmi hodoceí stejorodosti betou železobetoové kostrukce a prakticky provedete jede z možých způsobů
VíceP1: Úvod do experimentálních metod
P1: Úvod do epermetálích metod Chyby a ejstoty měřeí - Každé měřeí je zatížeo určtou epřesostí, která je způsobea ejrůzějším egatvím vlvy, vyskytujícím se v procesu měřeí. - Výsledek měřeí se díky tomu
VíceIV. MKP vynucené kmitání
Jří Máca - katedra mechaky - B35 - tel. 435 4500 maca@fsv.cvut.cz IV. MKP vyuceé kmtáí. Rovce vyuceého kmtáí. Modálí aalýza rozklad do vlastích tvarů 3. Přímá tegrace pohybových rovc 3. Metoda cetrálích
VíceOdhady parametrů 1. Odhady parametrů
Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě:
Více8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy
cvičící 8. cvičeí 4ST1 Obsah: Neparametricé testy Chí-vadrát test dobréshody Kotigečí tabuly Aalýza rozptylu (ANOVA) Vysoá šola eoomicá 1 VŠE urz 4ST1 Neparametricé testy Neparametricétesty využíváme,
Více1. Základy měření neelektrických veličin
. Základ měřeí eelektrckých velč.. Měřcí řetězec Měřcí řetězec (měřcí soustava) je soubor měřcích čleů (jedotek) účelě uspořádaých tak, ab blo ožě splt požadovaý úkol měřeí, tj. získat formac o velkost
Více3. cvičení 4ST201. Míry variability
cvčící Ig. Jaa Feclová 3. cvčeí 4ST0 Obah: Míry varablty Rozptyl Směrodatá odchyla Varačí oefcet Rozlad rozptylu a mezupovou a vtroupovou varabltu Změa rozptylu Vyoá šola eoomcá VŠE urz 4ST0 Míry varablty
VíceSTATISTIKA. Základní pojmy
Statistia /7 STATISTIKA Záladí pojmy Statisticý soubor oečá eprázdá možia M zoumaých objetů schromážděých a záladě toho, že mají jisté společé vlastosti záladí statisticý soubor soubor všech v daé situaci
VíceNeuronové sítě. Biologický neuron. Modely neuronu. 1. Logický neuron (McCulloch, Pitts, 1943) w R, x, y {0, 1} Biologický neuron.
Biologický euro Neuroové sítě Biologický euro Modely eurou Schéma eurou 1. Logický euro (McCulloch, Pitts, 1943) w R, x, y {0, 1} P. Berka, 2019 1/23 2. DLINE (Widrow, 1960) x, w R, y {0, 1} SUM = w i
Více6. FUNKCE A POSLOUPNOSTI
6. FUNKCE A POSLOUPNOSTI Fukce Dovedosti:. Základí pozatky o fukcích -Chápat defiici fukce,obvyklý způsob jejího zadáváí a pojmy defiičí obor hodot fukce. U fukcí zadaých předpisem umět správě operovat
VícePE 301 Podniková ekonomika 2. Garant: Eva KISLINGEROVÁ. Téma Metody mezipodnikového srovnávání. Téma 12. Eva Kislingerová
PE 30 Podiková ekoomika Garat: Eva KISLINGEROVÁ Téma Metody mezipodikového srováváí Eva Kisligerová Téma Eva Kisligerová Vysoká škola ekoomická v Praze 003 - Mezipodikové srováváí Poprvé 956- koferece
VíceSPOTŘEBITELSKÝ ÚVĚR. Na začátku provedeme inicializaci proměnných jejich vynulováním příkazem "restart". To oceníme při opakovaném použití dokumentu.
SPOTŘEBITELSKÝ ÚVĚR Úloha 3 - Fiacováí stavebích úprav Rozhodli jsme se pro stavebí úpravy v bytě. Po zhotoveí rozpočt a tyto úpravy jsme zjistili, že ám chybí ještě 30 000,-Kč. Máme možost si tto část
VíceStatistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.
Statistika Cíle: Chápat pomy statistický soubor, rozsah souboru, statistická edotka, statistický zak, umět sestavit tabulku rozděleí četostí, umět zázorit spoicový diagram a sloupcový diagram / kruhový
VíceDeskriptivní statistika 1
Deskriptiví statistika 1 1 Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 1145/2004. Základí charakteristiky souboru Pro lepší představu používáme k popisu vlastostí zkoumaého jevu určité charakteristiky
VíceAplikace teorie neuronových sítí
Aplikace teorie euroových sítí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické iforatiky Mateaticko-fyzikálí fakulta Uiverzity Karlovy v Praze Zpracováí časových vzorů (teporal processig) Stadardí algoritus
VícePřednáška č. 10 Analýza rozptylu při jednoduchém třídění
Předáška č. 0 Aalýza roztylu ř jedoduchém tříděí Aalýza roztylu je statstcká metoda, kterou se osuzuje romělvost oakovaých realzací áhodého okusu tj. romělvost áhodé velčy. Náhodá velča vzká za relatvě
VíceAgregace vzájemné spojování destabilizovaných částic ve větší celky, případně jejich adheze na povrchu jiných materiálů
Agregace - úvod 1 Agregace vzáemné spoování destablzovaných částc ve větší cely, případně ech adheze na povrchu ných materálů Částce mohou agregovat, poud vyazuí adhezní schopnost a poud e umožněno ech
VíceU klasifikace podle minimální vzdálenosti je nutno zvolit:
.3. Klasifikace podle miimálí vzdáleosti Tato podkapitola je věováa popisu podstaty klasifikace podle miimálí vzdáleosti, jež úzce souvisí s klasifikací pomocí etaloů klasifikačích tříd. Představíme si
VíceIlustrativní příklad ke zkoušce z B_PS_A léto 2013.
Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95
Více12. N á h o d n ý v ý b ě r
12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých
VíceVliv marketingového dotazování na identifikaci tržních segmentů
Vliv aretingového dotazování na identifiaci tržních segentů Jední z líčových fatorů stanovení optiální aretingové strategie e správně provedená identifiace a následné vyezení tržních segentů cílového trhu.
VíceStatistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).
Statstka. Základí pojmy Statstcký soubo - daá koečá, epázdá moža M předmětů pozoováí, majících jsté společé vlastost (událost, věc,.) Jedotlvé pvky této možy se azývají pvky statstckého soubou (statstcké
VíceHartre-Fock method (HF)
Cofgurato Iteracto (CI) Coupled Clusters (CC) Perturbato Theory (PT, MP) Electro correlato H Ψ = EΨ Bor-Oppehemer approxmato Model of depedet electros Product wave fucto (Slater determat) MO LCAO Hartre-Fock
VícePravděpodobnostní modely
Pravděpodobostí modely Meu: QCEpert Pravděpodobostí modely Modul hledá metodou maimálí věrohodosti (MLE Maimum Likelihood Estimate) statistický model (rozděleí) který ejlépe popisuje data. Je přitom k
VíceNázev školy: Gymnázium Jana Nerudy, škola hl. města Prahy. Předmět, mezipředmětové vztahy: matematika a její aplikace
Název: Kombiatoria Autor: Mgr. Haa Čerá Název šoly: Gymázium Jaa Nerudy, šola hl. města Prahy Předmět, mezipředmětové vztahy: matematia a její apliace Ročí: 5. ročí Tématicý cele: Kombiatoria a pravděpodobost
VíceNalezení výchozího základního řešení. Je řešení optimální? ne Změna řešení
Sipleová etoda: - patří ezi uiverzálí etody řešeí úloh lieárího prograováí. - de o etodu iteračí, t. k optiálíu řešeí dospíváe postupě, krok za kroke. - výpočetí algoritus se v každé iteraci rozpadá do
Vícezákladním prvkem teorie křivek v počítačové grafice křivky polynomiální n
Petra Suryková Modelováí křivek základím prvkem teorie křivek v počítačové grafice křivky polyomiálí Q( t) a a t... a t polyomiálí křivky můžeme sado vyčíslit sado diferecovatelé lze z ich skládat křivky
VíceANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DA prof. Ig. Jří Holčík, CSc. INVESICE Isttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a aalýz IV. LINEÁRNÍ KLASIFIKACE pokračováí Isttut bostatstky a aalýz (SUPPOR VECOR MACHINE SVM) SEPARABILNÍ
VíceAnalytické modely systémů hromadné obsluhy
Aalytcé odely systéů hroadé obsluhy ředěte teore hroadé obsluhy Kedallova lasface - ty SHO: X / Y / c / d / X ty stochastcého rocesu, terý osue říchody Y ty stochastcého rocesu terý osue délu obsluhy c
Více