Rozšíření bag-of-words modelu dokumentu: srovnání bigramů a 2-itemsetů

Rozměr: px
Začít zobrazení ze stránky:

Download "Rozšíření bag-of-words modelu dokumentu: srovnání bigramů a 2-itemsetů"

Transkript

1 Rozšíření bag-of-words modelu dokumentu: srovnání bgramů a 2-temsetů Roman Tesař 1, Massmo Poeso 2, Václav Strnad 1, Karel Ježek 1 1 Katedra Informatky a výpočetní technky, Západočeská Unverzta v Plzn, Unveztní 8, , Plzeň, Česká republka {romant, vaclavs, jezek_ka}@kv.zcu.cz 2 Katedra Výpočetní technky, Unverzta v Essexu, Wvenhoe Park, Colchester CO4 3SQ, Velká Brtáne poeso@essex.ac.uk Abstrakt. Jedním ze základních přístupů př kategorzac textu je reprezentovat dokumenty jednotlvým slovy. Tento přístup je označován jako bag-of-words nebo také sngle words-based. Ncméně dalším obohacením této reprezentace je možné dosáhnout zlepšení výsledků klasfkace. V této prác jsme zaměřl svou pozornost na porovnání přínosu bgramů a 2-temsetů, o které je rozšířen klascký bag-of-words model dokumentu. K expermentům využíváme standardní anglcké textové korpusy Reuters a 20 Newsgroups. Ke klasfkac je použt multnomal Nave Bayes, protože pro tuto klasfkační metodu a výše zmíněné korpusy byla publkována řada odborných publkací, se kterým naše dosažené výsledky srovnáváme. K výběru charakterstckých položek (feature selecton) využíváme 5 různých přístupů. Naše expermenty ndkují, že použtím bgramů a 2-temsetů je možné statstcky významně zvýšt úspěšnost klasfkace. Dále je v případě 2-temsetů velm důležté zvolt vhodný způsob výběru charakterstckých položek. Na druhou stranu, v případě bgramů je možné dosáhnout zlepšení úspěšnost klasfkace použítím velm jednoduchého přístupu. Z našch expermentů usuzujeme, že není přílš efektvní rozšřovat reprezentac textového dokumentu o 2-temsety, protože pomocí bgramů je možné dosáhnout lepších výsledků a jejch generování je oprot 2-temsetům méně náročné. Klíčová slova: zpracování textu, výběr položek, klasfkace, model dokumentu, bgram, 2-temset, n-gram, temset, srovnání. 1 Úvod Automatcká klasfkace textu je jednou z významných úloh př zpracování přrozeného jazyka a představuje zařazování nově příchozích dokumentů do předem defnovaných tříd. V této oblast bylo zvěřejněno mnoho publkací a mnoho algortmů bylo navrženo a zkoumáno. V současné době je tento problém stále více aktuální, protože objem dat nejen na nternetu neustále roste a najít požadované nformace mnohdy není snadné. Nejen vhodný klasfkátor textu, ale odpovídající reprezentace dokumentu ovlvňuje výslednou úspěšnost klasfkace. Ta je často velm dobrá, když je dokument reprezentován jen samostatným slovy (tento přístup je označován jako sngle wordsbased nebo bag-of-words, dále jen BOW). Ncméně rozšířením BOW reprezentace

2 lze celkovou úspěšnost klasfkace dále zlepšt. Jednou z možností je použít k tomuto účelu n-gramy [15, 20, 5] nebo temsety [12, 13, 23]. N-gram (v případě slov označovaný také jako fráze) je obecně sekvence n prvků z dané posloupnost, které následují po sobě a zachovávají tedy své původní pořadí. Př zpracování textu mohou být prvky reprezentovány například písmeny. Tento přístup byl úspěšně použt v [1] př kategorzac dokumentů ve vícejazyčném korpusu. V této prác [1] byly použty a srovnány multnomální Nave Bayes klasfkátor, k- Nearest Neghbours (knn) klasfkační algortmus a Roccho algortmus. Z výsledků je patrné, že multnomální Nave Bayes klasfkátor dosáhl nejkratšího času zpracování a nejvyšší úspěšnost klasfkace. Dalším, častěj používaným, přístupem př kategorzac textu je použít sekvence slov místo písmen. V [15] byly dokumenty reprezentovány nejen jednotlvým slovy, ale slovním n-gramy do délky 5. Bylo pozorováno, že n-gramy do délky 3 v kombnac s Nave Bayes klasfkátorem mohou zlepšt úspěšnost klasfkace, přčemž nejvyšší přínos byl pozorován př obohacení BOW modelu dokumentu o 2- gramy (označované také jako bgramy). N-gramy pro n>3 jž neměly vlv na výsledek klasfkace. V [10] bylo pozorováno, že delší slovní sekvence mohou výslednou úspěšnost klasfkace dokonce ovlvnt negatvně. V [15] a [20] byly n-gramy úspěšně použty k obohacení BOW modelu dokumentu, byly tedy použty současně se samostatným slovy. Další možností je použít n- gramy místo jednotlvých slov, kterým jsou n-gramy tvořeny. V takovém případě tedy BOW reprezentace neobsahuje slova, která jsou jž v některém n-gramu obsažena. Jak bylo ukázáno v [20] a zmíněno v [5], tento přístup vede ve většně případů ke zhoršení výsledků klasfkace, zatímco př použtí předchozího je možné dosáhnout znatelného zlepšení. Př generování n-gramů mohou být místo všech slov uvažována například jen slovesa, podstatná jména nebo přídavná jména, u kterých se očekává větší důležtost. Jak bylo zmíněno v [5], výzkumníc př použtí tohoto přístupu také dosáhl určtých zlepšení. Ncméně v [4] je zmíněn fakt, že dosáhnout statstcky významné zlepšení úspěšnost klasfkace rozšířením BOW modelu dokumentu o n-gramy není snadné a je většnou dosaženo jen př použtí postupů, které nejsou "state-of-the-art". Tento fakt ndkuje, že BOW model dokumentu je dostatečný a není jednoduché ho vylepšt. Pro generování n-gramů exstuje mnoho algortmů, některé z nch mohou být nalezeny např. v [15, 10, 21]. Př zpracování textu jsou ke zlepšení úspěšnost klasfkace často používány také temsety. Obvykle reprezentují množnu n slov, které se současně vyskytují v dokumentu. Také obohacením BOW reprezentace dokumentů o temsety se jž zabývalo mnoho výzkumníků. V [23] byla použta mult-varate Bernoullho verze Nave Bayes klasfkátoru a BOW reprezentace dokumentu byla obohacena o často se vyskytující temsety. Výsledky klasfkace ukázaly určté zlepšení a také větší vyváženost př použtí temsetů. K jejch generování zde byl použt známý Apror algortmus, jehož několk modfkací bylo popsáno a úspěšně použto například v [2] nebo [12]. Podobně jako v [23], také v [12] bylo pozorováno zlepšení úspěšnost klasfkace př použtí temsetů a popsáno zajímavé chování pro klasfkační třídy s velkým počtem dokumentů se přesnost klasfkace zvyšovala s počtem přdaných temsetů, zatímco pro menší třídy byl efekt opačný. Jedním z prezentovaných vysvětlení byla možnost, že obohacení BOW reprezentace dokumentů o přílš mnoho a přílš dlouhé temsety způ-

3 sobí nevyváženost v trénovacích datech a chybné odhady pravděpodobností pro třídy s malým počtem dokumentů. V [23] v [12] byl použt práh mnmálního výskytu pro výběr častých temsetů určených k obohacení BOW modelu dokumentu. Protože zde nebyl určen maxmální počet slov, které mohl temset obsahovat, jejch počet v rámc jednoho temsetu mohl být teoretcky velm velký. Jak bylo ovšem v [12] poznamenáno, delší temsety jsou méně časté a tudíž pravděpodobnost jejch výběru je malá. Ke generování temsetů je k dspozc mnoho algortmů. Tato oblast je poměrně ntenzvně zkoumána, protože se jedná o časově paměťově náročný problém. Pops a srovnání několka možných přístupů, včetně Apror algortmu, je prezentován v [26]. Obecně řečeno, n-gramy jsou podmnožnou temsetů. Př blžším zkoumání je patrné, že toto tvrzení neplatí zcela. V souladu s defncí temsetů a algortmy pro jejch generování se temset může skládat jen ze vzájemně různých slov. Je však zřejmé, že n-gramy stejná slova obsahovat mohou a algortmy určené k jejch generování to umožňují [10, 15, 21]. Ncméně praktcky je poměrně vzácné získat n-gram obsahující stejná slova, zvláště v případě delších n-gramů. Obvykle jsou reprezentovány specálním výrazy, například moucha tse tse nebo náboj dum dum. Tudíž n-gramy mohou být někdy nkolv úplnou, ale jen částečnou podmnožnou temsetů. V této prác zaměřujeme svou pozornost na srovnání přínosu slovních n-gramů a temsetů s ohledem na úspěšnost klasfkace textu. K tomu používáme multnomal Nave Bayes klasfkátor (vz [11, 19]) a dva často používané korpusy, na kterých testujeme, zda mohou být dosaženy lepší výsledky klasfkace rozšířením BOW modelu dokumentu o n-gramy nebo temsety a jaký počet n-gramů nebo temsetů zlepší výsledky klasfkace statstcky významně. Na základě pozorování uvedených v [15, 10] a dalších jsme se rohodl porovnat pouze vlv 2-gramů a 2-temsetů, protože ty především přspívají ke zlepšení úspěšnost klasfkace. 2 Generování n-gramů a temsetů Jak jž bylo zmíněno dříve, n-gramy jsou označovány také jako slovní sekvence nebo fráze. Př zpracování přrozeného jazyka jsou rozlšovány statstcké a syntaktcké fráze [14, 7]. Autoř publkace [14] nepozoroval velké rozdíly v úspěšnost klasfkace mez syntaktckým a statstckým frázem. Kromě toho, v [9] nebyl patrný žádný přínos př použtí syntaktckých frází na kolekc Reuters Protože v naší prác jsme chtěl využít tento korpus, rohodl jsme se zaměřt jen na statstcké fráze. Př našch expermentech jsme ke generování n-gramů použl algortmus prezentovaný v [21], který je modfkací Suffx Tree Clusterng algortmu popsaného v [24]. Pro generování temsetů jsme využl upravený Apror algortmus (vz [26]). 3 Výběr charakterstckých položek Výběr charakterstckých položek (feature selecton) je technka sloužící k výběru podmnožny takových položek dostupných z datové kolekce, které jsou pro klasfkac nejpřínosnější. Tím je možné dmenz kolekce podstatně zmenšt a odstrant položky

4 negatvně ovlvňující klasfkac. V této oblast bylo mnoho publkováno, nejvhodnější pro naš úlohu, a také často ctované, jsou [22] a [16]. Protože počet vygenerovaných 2-gramů a 2-temsetů může být obrovský, zvoll jsme několk různých metod k výběru jen těch nejvhodnějších. Uvažujeme-l, že f reprezentuje položku z datové kolekce (v našem případě bgram nebo 2-temset) a c klasfkační třídu, je v následujících kaptolách použta tato notace: A B C D N k je počet kolkrát se f vyskytuje v dokumentech patřících do c je počet kolkrát se f vyskytuje v dokumentech nepatřících do c je počet kolkrát se f nevyskytuje v dokumentech patřících do c je počet kolkrát se f nevyskytuje v dokumentech nepatřících do c je počet všech dokumentů v kolekc je počet všech klasfkačních tříd v kolekc Některé metody pro výběr charakterstckých položek berou v potaz podmíněné pravděpodobnost jednotlvých slov, ze kterých se 2-temset skládá [13]. V této prác jsme použl stejný přístup jako například v [23], kde jsou 2-temsety považovány za neděltelnou položku stejně jako bgramy nebo samostatná slova. 3.1 Metoda χ 2 (CHI) Metoda χ 2 určuje závslost mez položkou f a třídou c [22] a obecně je známa její nespolehlvost pro nepřílš časté položky. Je defnována jako 2 2 N ( AD CB) χ ( f, c) = (1) ( A + C) ( B + D) ( A + B) ( C + D) Pokud je f nezávslá na c, výsledek vzorce je 0. Protože tento vzorec produkuje jednu hodnotu pro každou klasfkační třídu zvlášť, použl jsme pro stanovení celkového významu položky f v kolekc vždy jen nevyšší hodnotu χ 2 max k 2 ( χ ( f, c )) ( f ) = max (2) Tento přístup se osvědčl nejen v [22], ale pozděj v [17]. Proto jsme ho aplkoval na dále popsané metody produkující hodnoty pro každou klasfkační třídu zvlášt. = Mutual Informaton (MI) Tato metoda stanovuje, kolk nformace přnáší přítomnost položky f o třídě c. Převzal jsme stejný způsob výpočtu jako byl použt v [22]: P( f c) A N MI( f, c) = (3) P( f ) P( c) ( A + C) ( A + B) Pokud jsou f a c nezávslé, hodnota vzorce je 0. Metoda MI upřednostňuje nepřílš časté položky a může proto dosahovat horších výsledků [22].

5 3.3 Odds Rato (OR) OR je metoda podávající dobré výsledky zejména v kombnac s Nave Bayes klasfkátorem [15, 16]. Protože vyžaduje nformac o výskytu f v dokumentech nepatřících do c, uvažujeme zde vždy všechny dokumenty kolekce ze všech tříd kromě c. Pokud A P( f c) =, B P( f, c) =, A + C B + D potom je OR defnováno jako P( f, c) ( 1 P( f, c) ) OR( f, c) =. (4) 1 P( f, c) P( f, c ( ) ) Ze vzorce (4) je patrné, že pokud P(f,c)=1 nebo P(f, c )=0, tedy v případech, kdy se f vyskytuje pouze v dokumentech třídy c, potom OR(f,c)=. V takových případech uvažujeme dodatečné ohodnocení pomocí DF(f c) (vz sekce 3.5). 3.4 Informaton Gan (IG) IG určuje obecnou významnost položky f s ohledem na všechny klasfkační třídy a je stanoven jako k = 1 k IG( f ) = P( c )log P( c ) + P( f ) P( c f )log P( c f ) + P( f ) P( c f )log P( c f ), (5) = 1 kde P(c ), P(c f ) a P(c f ) jsou určeny následujícím způsobem A + C P( c ) =, N A P( c f ) =, A + B k = 1 C P( c f ) =. C + D Tuto defnc jsme převzal z [22], kde IG podával dobré výsledky ve srovnání s jným metodam. Ncméně, jak bylo uvedeno v [17], položky s nžší entropí mají nžší IG ohodnocení, ačkolv mohou být slně korelované s c. To je způsobeno faktem, že IG stoupá také s nárůstem entrope položky f. 3.5 Document Frequency (DF) Prahování pomocí DF je jedním z nejjednodušších přístupů pro výběr charakterstckých položek a je obvykle považováno za "ad hoc" přístup. DF určuje počet dokumentů třídy c, ve kterých se vyskytuje položka f a může být stanoven jako DF ( f c) = A. (6) Navzdory své jednoduchost bylo v [18] a [22] ukázáno, že DF je důležtou metrkou, protože upřednostňuje časté položky, což se zdá být významnou charakterstkou.

6 4 Expermenty Jak jž bylo zmíněno, pro porovnání vlvu bgramů a 2-temsetů byla zvolena multnomální verze Nave Bayes klasfkátoru. Pro obě použté datové kolekce (vz sekce 4.1) jsme vždy uvažoval výsledek klasfkace s použtím všech slov jako základ, oprot kterému jsme porovnával přínos určtého počtu bgramů a 2-temsetů, které byly vybrány přístupy popsaným v kaptole 3. Protože některé z těchto přístupů (např. MI a OR) zvýhodňují málo se vyskytující položky, které nemohou výrazněj ovlvnt klasfkac, uvažoval jsme u obou kolekcí jen bgramy a 2-temsety s určtým mnmálním počtem výskytů. K ověření statstcké významnost výsledků jsme použl neparametrcký McNemarův test (vz [8]) a 99% nterval spolehlvost. 4.1 Datové kolekce Reuters Bylo prokázáno (vz [5]), že tato kolekce je příkladem "smple" kolekce. Tím se rozumí, že s použtím několka málo vhodně vybraných slov je možné se velm přblížt nejlepšímu výsledku klasfkace, který byl prozatím na této kolekc dosažen. Ncméně z [19] je patrné, že použtí všech slov ke klasfkac stále poskytuje nejlepší výsledek. Pro naše expermenty jsme zvoll ModApté verz kolekce Reuters-21578, ze které jsme využl jen 10 nejčastěj zastoupených tříd, kdy je celkový počet trénovacích dokumentů 6490, testovacích 2545 a 1.1 průměrný počet tříd na dokument. Stejný přístup byl aplkován např. v [11, 2, 19]. Z kolekce jsme v rámc předzpracování odstranl stopslova a čísla. Všechna písmena byla následně převedena na malá. Stemmng an lematzace nebyly použty. Po fáz předzpracování obsahovala trénovací sada dokumentů různých slov s průměrným počtem 73 slov na dokument a průměrným počtem 47 různých slov na dokument. Protože tato kolekce obsahuje dokumenty zařazené do více tříd současně, použl jsme Nave Bayes klasfkátor pro každou ze tříd zvlášť, což je obvyklý přístup, označovaný také jako one-vs-rest Newsgroups Oprot předchozí není tato kolekce "smple" kolekcí (vz [5]) - tedy každé slovo, které je použto ke klasfkac, přspívá ke zlepšení výsledku klasfkace. Pro naše účely jsme zvoll "bydate" verz 20 Newsgroups kolekce, která obsahuje trénovacích a 7532 testovacích dokumentů. I zde jsme aplkoval stejný postup předzpracování jako na předchozí kolekc, čímž jsme získal unkátních slov v trénovací množně dokumentů, průměrný počet slov na dokument 153 a průměrně 99 různých slov v dokumentu. 4.2 Výsledky testů na kolekc Reuters U této kolekce jsme pro generování bgramů a 2-temsetů uvažoval jen slova s četností 2 a více, což zredukovalo jejch počet z na Na vygenerované bgramy a 2-temsety jsme aplkoval stejný práh, což zredukovalo počet temsetů

7 z na a počet bgramů z na Z těchto hodnot je patrné, že počet řídce se vyskytujících položek v kolekc Reuters je značný. To může být jedním z důvodů, proč jen několk málo nejčastějších slov poskytuje dobré výsledky př klasfkac a zahrnutí dalších už nepřnáší přílš výrazné zlepšení. Hodnota 0 na ose X (pro Obr. 1 až 4) představuje stuac, kdy byla ke klasfkac použta pouze slova. Dosaženo zde bylo hodnoty mcro-f1= 89.20% (vz spodní část Tab. 1 a 2), kterou chápeme jako základ a se kterou dále srovnáváme. Jak je patrné, kromě MI vykazují ostatní přístupy ke generování charakterstckých položek významný pokles výsledků klasfkace, zvláště př použtí malého počtu přdaných 2- temsetů (Obr. 1) mcro-f1 [%] DF MI CHI OR Mcro F1 [%] DF MI CHI OR 78 IG 78 IG 76 počet přdaných 2-temsetů 76 počet přdaných bgramů Obr. 1. Závslost mcro-f1 na počtu přdaných 2-temsetů pro kolekc Reuters Tabulka 1. Nejlepší výsledky pro 2-temsety na kolekc Reuters přdané mcro macro odebrané mcro macro BEP BEP 2-temsety F1 F1 2-temsety F1 F1 DF CHI MI OR IG (základ) Obr. 2. Závslost mcro-f1 na počtu přdaných bgramů pro kolekc Reuters Tabulka 2. Nejlepší výsledky pro bgramy na kolekc Reuters přdané mcro macro odebrané mcro macro BEP bgramy F1 F1 bgramy F1 F1 BEP DF CHI MI OR IG (základ) Př blžším zkoumání se potvrdlo, že MI upřednostňuje málo časté položky, které obecně nemohou významně ovlvnt výsledek klasfkace. Ncméně na základě vzorce 3 byly vybrány 2-temsety z tříd s menším počtem dokumentů, což pomohlo v jejch lepší dentfkac. Oprot tomu DF, CHI a IG upřednostňují spíše časté položky, což se nezdá být vhodný přístup u této kolekce. Příčnou může být fakt, že se jedná o "smple" kolekc (vz sekce 4.1), kde jednotlvá slova postačují k rozlšení jednotlvých tříd a rozšířením tohoto sngle words-based modelu o přílš časté 2-temsety, které mají výrazný vlv na Nave Bayes klasfkátor, může být model dokumentů v kolekc zkreslen a tím zhoršen výsledek klasfkace. Jak jž bylo zmíněno v [22], DF, CHI a IG jsou slně korelovány a jejch chování je tedy podobné. OR má zajímavé chování. Pro malý počet přdaných 2-temsetů se výsledek klasfkace zhoršuje. Ncméně, na rozdíl od CHI a IG, použtím více 2-temsetů s nžším ohodnocením znatelně zlepšuje výsledek klasfkace. Důvodem může být fakt, že 1000 nejlépe ohodnocených 2- temsetů pomocí OR je převážně jen ze třídy earn, která obsahuje nejvíce dokumentů. Dále však jž třída earn nedomnuje a přítomny jsou především 2-temsety z tříd s méně dokumenty, což je v kontrastu především vzhledem k DF a IG. Navíc, jak bylo ukázáno v [16], OR upřednostňuje položky s častějším výskytem v dané třídě před

8 položkam, které se v dané třídě nevyskytují, což se zdá být vhodný přístup př použtí Nave Bayes klasfkátoru. Jak je patrné z Obr. 1, pouze 2-temsety vybrané pomocí OR a MI byly schopny překročt základní mcro-f1 hodnotu 89.20%. Tato zlepšení ale nejsou statstcky významná. Levá strana Tab. 1 obsahuje nejlepší hodnoty z charakterstk na Obr. 1. V případě bgramů je stuace odlšná. Jak je patrné z Obr. 2, všechny přístupy pro výběr charakterstckých položek překonaly základní mcro-f1 hodnotu 89.20%. I zde došlo nejprve v případě DF, CHI, OR a IG k poklesu úspěšnost klasfkace, avšak méně výraznému. Navzdory faktu, že bgramy mají obecně menší počet výskytů v kolekc než 2-temsety a je jch podstatně méně, jejch přínos př klasfkac je větší. V levé část Tab. 2 jsou nejlepší výsledky z charakterstk na Obr. 2. Všechna zlepšení oprot základu 89.20% jsou statstcky významná. S ohledem na fakt, že přílš časté 2-temsety a bgramy u kolekce Reuters znatelně zhoršují výsledky klasfkace, jsme se rozhodl určtý počet těch nejlépe ohodnocených jednotlvým přístupy neuvažovat. Pro každý z přístupů jsme ponechal počet 2-temsetů a bgramů, u kterého bylo dosaženo nejlepších výsledků (vz Tab. 1 a 2 vlevo), a odebíral postupně nejlépe ohodnocené položky. Výsledky pro 2- temsety a bgramy jsou uvedeny v Tab. 1 a 2 vpravo. Z Tab. 1 je patrné, že pouze u OR došlo ke zlepšení př odebrání nejlépe ohodnocených 2-temsetů (o ostatních metod žádné zlepšení oprot základní mcro-f1 hodnotě nenastalo), což jsme vzhledem k charakterstce na Obr. 1 očekával. Zlepšení z 89.79% na 90.44% je statstcky významné. Odebráním menšího počtu nejlépe ohodnocených bgramů došlo (vz Tab. 2), kromě MI, u všech ostatních přístupů ke zlepšení výsledků klasfkace (ncméně statstcky nevýznamnému). Ačkolv jsou rozdíly mez DF, CHI, OR a IG malé, OR zde podává nejlepší výsledky. Podobný závěr byl učněn v [16], kde Nave Bayes klasfkátor vykazoval v kombnac s OR nejlepší výsledky. Na základě nám známých publkovaných prací je doposud nejlepším výsledkem dosaženým na kolekc Reuters hodnota break-even-pont (BEP = bod, kde jsou hodnoty přesnost a úplnost klasfkace stejné) 92% a byla dosažena pomocí SVM klasfkátoru a MI přístupu (vz [9]). Náš výsledek BEP=91.67% dosažený pomocí Nave Bayes klasfkátoru a OR přístupu rozšířením sngle words-based modelu dokumentu o vhodný počet bgramů je poměrně blízko této hodnotě. Je to bezpochyby způsobeno faktem, že Reuters je příkladem "smple" kolekce (vz sekce 4.1.1). 4.3 Výsledky testů na kolekc 20 Newsgroups Tato kolekce obsahovala po předzpracování unkátních slov. Př výběru charakterstckých položek jsme uvažoval jen slova s mnmálním počtem výskytů 5 a více, což zredukovalo jejch počet na Z nch jsme získal bgramů. Počet 2-temsetů není díky mplctním optmalzačním procesům k dspozc. Protože počet položek je poměrně velký, aplkoval jsme, podobně jako u předchozí kolekce, na vygenerované bgramy a 2-temsety mnmální práh výskytu uvažoval jsme jen položky s výskytem 4 a více. Tento krok zredukoval počet bgramů na a počet 2-temsetů na Obr. 3 prezentuje mcro-f1 charakterstky jednotlvých přístupů pro výběr 2-temsetů. Základní mcro-f1 hodnota, ze které jsme vycházel a kterou jsme získal použtím všech unkátních slov ke klasfkac, je 79.3%.

9 Mcro F1 [%] Mcro F1 [%] DF MI CHI OR 76 DF MI CHI OR IG počet přdaných 2-temsetů 75 IG počet přdaných bgramů Obr. 3. Závslost mcro-f1 na počtu přdaných 2-temsetů pro kolekc 20 Newsgroups Tabulka 3. Nejlepší výsledky pro 2-temsety na kolekc 20 Newsgroups přdaných 2-temsetů mcro F1 macro F1 DF CHI MI OR IG (baselne) Obr. 4. Závslost mcro-f1 na počtu přdaných bgramů pro kolekc 20 Newsgroups Tabulka 4. Nejlepší výsledky pro bgramy na kolekc 20 Newsgroups přdaných bgramů mcro F1 macro F1 DF CHI MI OR IG (baselne) U této kolekce se zdá být CHI nejvhodnějším přístupem pro generování 2-temsetů (vz Obr. 3). Přblžně prvních temsetů způsobuje pokles úspěšnost klasfkace, který je ovšem méně výrazný než u předchozí kolekce a dále následuje postupné zlepšování výsledků. MI a OR se chovají podobně a především z důvodu výběru převážně méně častých položek neovlvňují výrazně průběh klasfkace. DF a IG nepodávají dobré výsledky z důvodu výběru především 2-temsetů, které jsou velm časté v několka třídách současně. IG navíc nerozlšuje mez přítomností a absencí položky ve třídě, což patrně není vhodný přístup pro kombnac s multnomální verzí Nave Bayes klasfkátoru, který bere v potaz jen výskyt položky. Podobný závěr byl předložen také v [16]. U této kolekce je rozdíl mez nejhorší a nejlepší dosaženou hodnotou př využtí 2-temsetů znatelně menší než u kolekce předchozí. Důvodem může být fakt, že 20 Newgroups má rovnoměrnější dstrbuc dokumentů v jednotlvých třídách a není příkladem "smple" kolekce. Nejlepší dosažené hodnoty z Obr. 3 jsou k dspozc v Tab Pouze v případě CHI se jedná o statstcky významné zlepšení. Na Obr. 4 jsou k dspozc charakterstky pro bgramy. Jak je patrné, nedochází zde př využtí nejlépe ohodnocených bgramů k poklesu úspěšnost klasfkace. CHI se zdá být vhodné př využtí jen menšího počtu nejlépe ohodnocených bgramů, zatímco OR podává dobré výsledky především př využtí jejch většího počtu. CHI zde pravděpodobně vhodně kombnuje výběr položek nejlépe charakterzujících jednotlvé třídy s četnostm jejch výskytů, což přnáší zlepšení úspěšnost klasfkace př využtí jen malého počtu bgramů. MI a OR stále vybírají většnou méně časté bgramy, což v tomto případě přnáší také zlepšení, zejména př použtí a bgramů. 2 V Tab. 3 a 4 nejsou uvedeny hodnoty BEP, protože v kolekc 20 Newsgroups patří každý dokument jen do jedné třídy a tedy mcro-f1 a BEP hodnoty jsou stejné.

10 DF je svým jednoduchým přístupem také použtelné v této klasfkační úloze, což ndkuje, že bgramy pravděpodobně způsobují př reprezentac dokumentů menší zkreslení než 2-temsety. Těch je obvykle vygenerováno mnohem více a je tedy náročnější vybrat jen ty vhodné. Korelace mez IG a DF je u této kolekce patrná. Nejlepší dosažené výsledky pro charakterstky z Obr. 4 jsou uvedeny v Tab. 4. Všechna zde uvedená zlepšení jsou oprot základu 79.30% statstcky významná. Podobný základ, jenž jsme uvažoval u této kolekce, byl uvažován v [19] a naše nejlepší dosažená hodnota mcro-f1=80.63% (vz Tab. 4) je srovnatelná s [3]. Ncméně v [6] byl také použt Nave Bayes klasfkátor s několka odlšným modely dokumentu a bylo zde dosaženo úspěšnost klasfkace mcro-f1=82.21%. Př použtí klasfkátoru SVM s jádrem NGD byla v [25] publkována úspěšnost klasfkace 84.61% na kolekc 20 Newsgroups ("bydate" verze). 5 Závěr V naší prác jsme se zaměřl na srovnání přínosu 2-temsetů a bgramů použtých k obohacení modelu dokumentu založeném jen na slovní reprezentac (BOW) př klasfkac textu. Výsledky na dvou anglckých kolekcích ndkují, že 2-temsety jsou přílš obecné a vyvolávají často př klasfkac nežádoucí zkreslení. Velký počet vygenerovaných 2-temsetů společně s nevyváženým zastoupením klasfkačních tříd v datové kolekc vyžaduje pečlvý výběr metody pro výběr charakterstckých položek. Naprot tomu, bgramy se zdají být vhodnější pro úlohu klasfkace. Výběr charakterstckých bgramů není tolk závslý na použtém přístupu. Uvážíme-l, že Apror algortmus a jné určené ke generování temsetů jsou většnou časově paměťově mnohem náročnější než algortmy ke generování bgramů, nezdá se být přílš efektvní rozšířovat př klasfkac model dokumentu o 2-temsety. Stejného, případně lepšího, výsledku lze dosáhnout použtím bgramů. V budoucnu se chystáme stejné expermenty zopakovat na kolekcích v českém jazyce, kde očekáváme podobné závěry. Tato práce byla částečně podporována z prostředků Národního Programu Výzkumu II, projekt 2C06009 (COT-SEWng). Reference 1. J.J.G. Adeva, R.A. Calvo and D.L. de Ipña. Multlngual Approaches to Text Categorsaton. UPGRADE: The European Journal for the Informatcs Professonal, Vol. VI, No. 3, pp , June M.L. Antone and O.R. Zaane. Text document categorzaton by term assocaton. In Proc. of the IEEE 2002 Internatonal Conference on Data Mnng, pages 19 26, Maebash Cty, Japan, L. Baol, L. Qn and Y. Shwen. An adaptve k-nearest neghbor text categorzaton strategy. ACM Transactons on Asan Language Informaton Processng (TALIP), volume 3, pp: , 2004.

11 4. R. Bekkerman, R. El-Yanv, N. Tshby and Y. Wnter. Dstrbutonal Word Clusters vs. Words for Text Categorzaton. Journal of Machne Learnng Research, 3: , R. Bekkerman and J. Allan. Usng Bgrams n Text Categorzaton. CIIR Techncal Report IR-408, A. Bratko and B. Flpč. Explotng Structural Informaton n Semstructured Document Classfcaton. Proc. 13th Internatonal Electrotechncal and Computer Scence Conference, ERK 2004, M. F. Caropreso, S. Matwn and F. Sebastan. Statstcal phrases n automated text categorzaton. Techncal Report IEI-B , Isttuto d Elaborazone dell'informazone, Psa, Italy, T.G. Detterch. Approxmate Statstcal Test for Comparng Supervsed Classfcaton Learnng Algorthms. Neural Computaton, Vol. 10, pp , S.T. Dumas, J. Platt, D. Heckerman and M. Saham. Inductve learnng algorthms and representatons for text categorzaton. In Proceedngs of ACM- CIKM98, pp , J. Fürnkranz. A study usng n-gram features for text categorzaton. Techncal Report OEFAI-TR-9830, Austran Insttute for Artfcal Intellgence, Venna, Austra, A. McCallum and K. Ngam. A Comparson of Event Models for Nave Bayes Text Classfcaton. In AAAI/ICML-98 Workshop on Learnng for Text Categorzaton, Techncal Report WS-98-05, AAAI Press, pp , D. Meretaks and B. Wüthrch. Extendng Nave Bayes classfers usng long temsets. In Proc. 5th ACM-SIGKDD Int. Conf. Knowledge Dscovery and Data Mnng (KDD'99), San Dego, USA, pp , D. Meretaks, D. Fragouds, H. Lu and S. Lkothanasss. Scalable assocatonbased text classfcaton. Proceedngs of the nnth nternatonal conference on Informaton and knowledge management, pp. 5-11, McLean, Vrgna, Unted States, November M. Mtra, C. Buckley, A. Snghal and C. Carde. An analyss of statstcal and syntactc phrases. In Proceedngs of RIAO-97, 5th Internatonal Conference "Recherche d'informaton Assstee par Ordnateur", pp , Montreal, CA, D. Mladenc and M. Grobelnk. Word sequences as features n text-learnng. In Proc. 17th Electrotechncal and Computer Scence Conference (ERK98), Slovena, D. Mladenc and M. Grobelnk. Feature Selecton for Unbalanced Class Dstrbuton and Nave Bayes. In Proceedngs of the 16th Internatonal Conference on Machne Learnng, Morgan Kaufmann, pp , V. Pekar, M. Krkoska and S. Staab. Feature Weghtng for Co-occurrence-based Classfcaton of Words. In Proceedngs of the 20th Conference on Computatonal Lngustcs, COLING-2004, August M. Rogat and Y. Yang. Hgh-performng feature selecton for text classfcaton. Proceedngs of the eleventh nternatonal conference on Informaton and knowledge management, McLean, Vrgna, USA, November 2002.

12 19. K.M. Schneder. A New Feature Selecton Score for Multnomal Nave Bayes Text Classfcaton Based on KL-Dvergence. 42nd Meetng of the Assocaton for Computatonal Lngustcs (ACL 2004), pp , Ch.M. Tan, Y.F. Wang and Ch.D. Lee. The use of bgrams to enhance text categorzaton. Informaton Processng and Management: an Internatonal Journal, v.38 n.4, p , July R. Tesar, D. Fala, F. Rousselot and K. Jezek. A comparson of two algorthms for dscoverng repeated word sequences. WIT Transactons on Informaton and Communcaton Technologes, Vol. 35, pp , Y. Yang and J.O. Pedersen. A Comparatve Study on Feature Selecton n Text Categorzaton. Proceedngs of the Fourteenth Internatonal Conference on Machne Learnng, pp , July, Z. Yang, Z. Ljun, Y. Janfeng and L. Zhanhua. Usng assocaton features to enhance the performance of Nave Bayes text classfer. Ffth Internatonal Conference on Computatonal Intellgence and Multmeda Applcatons, ICCIMA 2003, pp , O. Zamr and O. Etzon. Web document clusterng: A feasblty demonstraton. In Proceedngs of the 21st Annual Internatonal ACM SIGIR Conference on Research and Development n Informaton Retreval (SIGIR 98, Melbourne, Australa), W. B. Croft, A. Moffat, C. J. van Rjsbergen, R., Wlknson, and J. Zobel, Chars. ACM Press, New York, NY, pp , D. Zhang, X. Chen and W.S. Lee. Text classfcaton wth kernels on the multnomal manfold. Proceedngs of the 28th nternatonal ACM SIGIR conference on Research and development n nformaton retreval, Brazl, pp , Z. Zheng, R. Kohav and L. Mason. Real world performance of assocaton rule algorthms. In Int. Conf. on Knowledge Dscovery and Data Mnng (SIGKDD), August Annotaton: Extendng the Bag-of-Words Document Model: A Comparson of Bgrams and 2- Itemsets In ths paper, we compare the performance mprovement n terms of classfcaton accuracy when bgrams and 2-temsets are used to extend the sngle words-based document representaton on two standard text corpora: Reuters and 20 Newsgroups. The concluson s that t s not very effectve to extend document representaton wth 2-temsets. Bgrams acheve better results and dscoverng them s less resource-consumng. Ths paper s a shortened, Czech verson of the followng publcaton Tesar R., Poeso M., Strnad V., Jezek K.: "Extendng the Sngle Words-Based Document Model: A Comparson of Bgrams and 2-Itemsets. In Proceedngs of the 2006 ACM Symposum on Document Engneerng (DocEng 06), Amsterdam, Netherlands, ACM press, ISBN , pages , September (

Automatická klasifikace dokumentů do tříd za použití metody Itemsets

Automatická klasifikace dokumentů do tříd za použití metody Itemsets Automatcká klasfkace dokumentů do tříd za použtí metody Itemsets Jří HYNEK 1, Karel JEŽEK 2 1 nsite, s.r.o., Knowledge Management Integrator Rubešova 29, 326 00 Plzeň r.hynek@nste.cz 2 Katedra nformatky

Více

Hodnocení kvality sumarizátorů textů

Hodnocení kvality sumarizátorů textů Hodnocení kvalty sumarzátorů textů Josef Stenberger 1, Karel Ježek 1 1 Katedra nformatky a výpočetní technky, FAV, ZČU Západočeská Unverzta v Plzn, Unverztní, 306 14 Plzeň {jsten, jezek_ka}@kv.zcu.cz Abstrakt.

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

9.12.2009. Metody analýzy rizika. Předběžné hodnocení rizika. Kontrolní seznam procesních rizik. Bezpečnostní posudek

9.12.2009. Metody analýzy rizika. Předběžné hodnocení rizika. Kontrolní seznam procesních rizik. Bezpečnostní posudek 9.2.29 Bezpečnost chemckých výrob N Petr Zámostný místnost: A-72a tel.: 4222 e-mal: petr.zamostny@vscht.cz Analýza rzka Vymezení pojmu rzko Metody analýzy rzka Prncp analýzy rzka Struktura rzka spojeného

Více

Úvod Terminologie Dělení Princip ID3 C4.5 CART Shrnutí. Obsah přednášky

Úvod Terminologie Dělení Princip ID3 C4.5 CART Shrnutí. Obsah přednášky Obsah přednášky. Úvod. Termnologe 3. Základní dělení 4. Prncp tvorby, prořezávání a použtí RS 5. Algortmus ID3 6. C4.5 7. CART 8. Shrnutí A L G O RI T M Y T E O R I E Stromové struktury a RS Obsah knhy

Více

Automatizace generování stopslov

Automatizace generování stopslov Automatzace generování stopslov Bc. Jří Krupní, Ústav nformaty, Provozně eonomcá faulta, Mendelova unverzta v Brně, jr.rupn@mendelu.cz Abstrat Příspěve se zabývá metodou předzpracování textových doumentů,

Více

Umělé neuronové sítě a Support Vector Machines. Petr Schwraz

Umělé neuronové sítě a Support Vector Machines. Petr Schwraz Umělé neuronové sítě a Support Vector Machnes Petr Schraz scharzp@ft.vutbr.cz Perceptron ( neuron) x x x N f() y y N f ( x + b) x vstupy neuronu váhy jednotlvých vstupů b aktvační práh f() nelneární funkce

Více

Posuzování výkonnosti projektů a projektového řízení

Posuzování výkonnosti projektů a projektového řízení Posuzování výkonnost projektů a projektového řízení Ing. Jarmla Ircngová Západočeská unverzta v Plzn, Fakulta ekonomcká, Katedra managementu, novací a projektů jrcngo@kp.zcu.cz Abstrakt V současnost je

Více

Dynamika psaní na klávesnici v kombinaci s klasickými hesly

Dynamika psaní na klávesnici v kombinaci s klasickými hesly Dynamka psaní na klávesnc v kombnac s klasckým hesly Mloslav Hub Ústav systémového nženýrství a nformatky, FES, Unverzta Pardubce Abstract Authentfcaton as a data securty nstrument n our nformatonal socety

Více

BAYESŮV PRINCIP ZDENĚK PŮLPÁN

BAYESŮV PRINCIP ZDENĚK PŮLPÁN ROBUST 000, 7 4 c JČMF 00 BAYESŮV PRINCIP ZDENĚK PŮLPÁN Abstrakt. Poukážeme na možnost rozhodování pomocí Bayesova prncpu. Ten vychází z odhadu podmíněné pravděpodobnosta z předpokladu dsjunktního rozkladu

Více

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek 25. KONFERENCE O GEOMETRII A POČÍTAČOVÉ GRAFICE Ivana Lnkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE Abstrakt Příspěvek prezentuje B-splne křvku a Coonsovu, Bézerovu a Fergusonovu kubku jako specální případy

Více

Univerzita Pardubice Fakulta ekonomicko-správní. Modelování predikce časových řad návštěvnosti web domény pomocí SVM Bc.

Univerzita Pardubice Fakulta ekonomicko-správní. Modelování predikce časových řad návštěvnosti web domény pomocí SVM Bc. Unverzta Pardubce Fakulta ekonomcko-správní Modelování predkce časových řad návštěvnost web domény pomocí SVM Bc. Vlastml Flegl Dplomová práce 2011 Prohlašuj: Tuto prác jsem vypracoval samostatně. Veškeré

Více

Přemysl Žiška, Pravoslav Martinek. Katedra teorie obvodů, ČVUT Praha, Česká republika. Abstrakt

Přemysl Žiška, Pravoslav Martinek. Katedra teorie obvodů, ČVUT Praha, Česká republika. Abstrakt ALGORITMUS DIFERENCIÁLNÍ EVOLUCE A JEHO UŽITÍ PRO IDENTIFIKACI NUL A PÓLŮ PŘE- NOSOVÉ FUNKCE FILTRU Přemysl Žška, Pravoslav Martnek Katedra teore obvodů, ČVUT Praha, Česká republka Abstrakt V příspěvku

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE Jana Valečková 1 1 Vysoká škola báňská-techncká unverzta Ostrava, Ekonomcká fakulta, Sokolská

Více

Implementace bioplynové stanice do tepelné sítě

Implementace bioplynové stanice do tepelné sítě Energe z bomasy XVII, 13. 15. 9. 2015 Lednce, Česká republka Implementace boplynové stance do tepelné sítě Pavel MILČÁK 1, Jaroslav KONVIČKA 1, Markéta JASENSKÁ 1 1 VÍTKOVICE ÚAM a.s., Ruská 2887/101,

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

NÁVRH ALGORITMŮ NA BÁZI UMĚLÝCH IMUNITNÍCH SYSTÉMŮ PRO ÚLOHY KLASIFIKACE

NÁVRH ALGORITMŮ NA BÁZI UMĚLÝCH IMUNITNÍCH SYSTÉMŮ PRO ÚLOHY KLASIFIKACE NÁVRH ALGORITMŮ NA BÁZI UMĚLÝCH IMUNITNÍCH SYSTÉMŮ PRO ÚLOHY KLASIFIKACE Luděk Kopáček, Vladmír Ole Unverzta Pardubce, Fakulta ekonomcko-správní, Ústav systémového nženýrství a nformatky Abstract: The

Více

í I - 13 - Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI

í I - 13 - Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI - 13 - í Průchod a rozptyl záření gama ve vrstvách materálu Prof. ng. J. Šeda, DrSc. KDAZ - PJP Na našem pracovšt byl vypracován program umožňující modelovat průchod záření gama metodou Monte Carlo, homogenním

Více

INŽ ENÝ RSKÁ MECHANIKA 2002

INŽ ENÝ RSKÁ MECHANIKA 2002 Ná dní konference s mezná dní účastí INŽ ENÝ RSÁ MECHANIA 00 1. 16. 5. 00, Svratka, Č eská republka PODRITICÝ RŮ ST TRHLINY VE SVAROVÉ M SPOJI OMORY PŘ EHŘÍVÁ U Jan ouš, Ondřej Belak 1 Abstrakt: V důsledku

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

VOLBA HODNOTÍCÍCH KRITÉRIÍ VE VEŘEJNÝCH ZAKÁZKÁCH

VOLBA HODNOTÍCÍCH KRITÉRIÍ VE VEŘEJNÝCH ZAKÁZKÁCH VOLBA HODNOTÍCÍCH KRITÉRIÍ VE VEŘEJNÝCH ZAKÁZKÁCH THE CHOICE OF EVALUATION CRITERIA IN PUBLIC PROCUREMENT Martn Schmdt Masarykova unverzta, Ekonomcko-správní fakulta m.schmdt@emal.cz Abstrakt: Článek zkoumá

Více

Využití nástrojů GIS při analýze vztahů socio-ekonomických faktorů a úrovně sociální péče

Využití nástrojů GIS při analýze vztahů socio-ekonomických faktorů a úrovně sociální péče Využtí nástrojů GIS př analýze vztahů soco-ekonomckých faktorů a úrovně socální péče Renata Klufová Katedra aplkované matematky a nformatky, Ekonomcká fakulta JU, Studentská 13 370 05 České Budějovce,

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

VLIV APLIKOVANÉ TECHNOLOGIE NA EFEKTIVNOST V SEKTORU VÝROBY MLÉKA # THE EFFECT OF APPLIED TECHNOLOGY ON THE EFFICIENCY IN DAIRY PRODUCTION

VLIV APLIKOVANÉ TECHNOLOGIE NA EFEKTIVNOST V SEKTORU VÝROBY MLÉKA # THE EFFECT OF APPLIED TECHNOLOGY ON THE EFFICIENCY IN DAIRY PRODUCTION VLIV APLIKOVANÉ TECHNOLOGIE NA EFEKTIVNOST V SEKTORU VÝROBY MLÉKA # THE EFFECT OF APPLIED TECHNOLOGY ON THE EFFICIENCY IN DAIRY PRODUCTION JELÍNEK, Ladslav Abstract The objectve of the contrbuton s to

Více

Sumarizace textů. Univerzitní 8, Plzeň Karel Jezek 2 European Commission Joint Research Centre, IPSC Ispra

Sumarizace textů. Univerzitní 8, Plzeň Karel Jezek 2 European Commission Joint Research Centre, IPSC Ispra Sumarzace textů Karel JEŽEK 1, Josef STEINBERGER 2 1 Katedra nformatky a výpočetní technky, FAV ZČU v Plzn Unverztní 8, 306 14 Plzeň Karel Jezek 2 European Commsson Jont Research Centre,

Více

ROZHODOVÁNÍ VE FUZZY PROSTŘEDÍ

ROZHODOVÁNÍ VE FUZZY PROSTŘEDÍ ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LV 24 Číslo 6, 2007 ROZHODOVÁNÍ VE FUZZY PROSTŘEDÍ V. Konečný Došlo:

Více

Kinetika spalovacích reakcí

Kinetika spalovacích reakcí Knetka spalovacích reakcí Základy knetky spalování - nauka o průběhu spalovacích reakcí a závslost rychlost reakcí na různých faktorech Hlavní faktory: - koncentrace reagujících látek - teplota - tlak

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

Vícekriteriální rozhodování. Typy kritérií

Vícekriteriální rozhodování. Typy kritérií Vícekrterální rozhodování Zabývá se hodnocením varant podle několka krtérí, přčemž varanta hodnocená podle ednoho krtéra zpravdla nebývá nelépe hodnocená podle krtéra ného. Metody vícekrterálního rozhodování

Více

Teorie efektivních trhů (E.Fama (1965))

Teorie efektivních trhů (E.Fama (1965)) Teore efektvních trhů (E.Fama (965)) Efektvní efektvní zpracování nových nformací Efektvní trh trh, který rychle a přesně absorbuje nové nf. Ceny II (akcí) náhodná procházka Předpoklady: na trhu partcpuje

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

Příspěvky do Fondu pojištění vkladů Garančního systému finančního trhu

Příspěvky do Fondu pojištění vkladů Garančního systému finančního trhu Česká národní banka odbor regulace fnančního trhu V Praze dne 7. května 2018 Příspěvky do Fondu pojštění vkladů Garančního systému fnančního trhu Pojštění pohledávek z vkladů v Evropské un a stanovení

Více

ANALÝZA PRODUKCE OLEJNIN ANALYSIS OF OIL SEED PRODUCTION. Lenka Šobrová

ANALÝZA PRODUKCE OLEJNIN ANALYSIS OF OIL SEED PRODUCTION. Lenka Šobrová ANALÝZA PRODUKCE OLEJNIN ANALYSIS OF OIL SEED PRODUCTION Lenka Šobrová Anotace: Olejnny patří mez významné zemědělské plodny. Nejvýznamnější zástupc této skupny se však v jednotlvých částech světa lší,

Více

Obsah přednášky 1. Bayesův teorém 6. Naivní Bayesovský klasifikátor (NBK)

Obsah přednášky 1. Bayesův teorém 6. Naivní Bayesovský klasifikátor (NBK) Obsah přednášky 1. Bayesův teorém 2. Brutální Bayesovský klasfkátor (BBK) 3. Mamální aposterorní pravděpodobnost (MA) 4. Optmální Bayesovský klasfkátor (OBK) 5. Gbbsův alortmus (GA) 6. Navní Bayesovský

Více

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ 5. Odborná konference doktorského studa s meznárodní účastí Brno 003 POUŽITÍ METODY PERT PŘI ŘÍZEÍ PROJEKTŮ A USAGE OF PERT METHOD I PROJECT MAAGEMET Vladslav Grycz 1 Abstract PERT Method and Graph theory

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU AALÝZA RIZIKA A JEHO CITLIVOSTI V IVESTIČÍM PROCESU Jří Marek ) ABSTRAKT Príspevek nformuje o uplatnene manažmentu rzka v nvestčnom procese. Uvádza príklad kalkulace rzka a analýzu jeho ctlvost. Kľúčové

Více

SIMULACE A ŘÍZENÍ PNEUMATICKÉHO SERVOPOHONU POMOCÍ PROGRAMU MATLAB SIMULINK. Petr NOSKIEVIČ Petr JÁNIŠ

SIMULACE A ŘÍZENÍ PNEUMATICKÉHO SERVOPOHONU POMOCÍ PROGRAMU MATLAB SIMULINK. Petr NOSKIEVIČ Petr JÁNIŠ bstrakt SIMULCE ŘÍZENÍ PNEUMTICKÉHO SERVOPOHONU POMOCÍ PROGRMU MTL SIMULINK Petr NOSKIEVIČ Petr JÁNIŠ Katedra automatzační technky a řízení Fakulta stroní VŠ-TU Ostrava Příspěvek popsue sestavení matematckého

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

Znamená vyšší korupce dražší dálnice? Evidence z dat Eurostatu. Michal Dvořák *

Znamená vyšší korupce dražší dálnice? Evidence z dat Eurostatu. Michal Dvořák * Znamená vyšší korupce dražší dálnce? Evdence z dat Eurostatu Mchal Dvořák * Článek je pozměněnou verzí práce Analýza vztahu mez mírou korupce a cenovou úrovní nfrastrukturních staveb, kterou autor zakončl

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

VÝPOČET NÍZKOCYKLOVÉ ÚNAVY JADERNÉ ARMATURY DLE NORMY NTD A.S.I. SEKCE III. JIŘÍ TÁBORSKÝ*, LINA BRYUKHOVA KRÁLOVOPOLSKÁ STRESS ANALYSIS GROUP, s.r.o.

VÝPOČET NÍZKOCYKLOVÉ ÚNAVY JADERNÉ ARMATURY DLE NORMY NTD A.S.I. SEKCE III. JIŘÍ TÁBORSKÝ*, LINA BRYUKHOVA KRÁLOVOPOLSKÁ STRESS ANALYSIS GROUP, s.r.o. 20th SVSFEM ASYS Users' Group Meetng and Conference 202 VÝPOČET ÍZKOCYKLOVÉ ÚAVY JADERÉ ARMATURY DLE ORMY TD A.S.I. SEKCE III JIŘÍ TÁBORSKÝ*, LIA BRYUKHOVA KRÁLOVOPOLSKÁ STRESS AALYSIS GROUP, s.r.o. Abstract:

Více

REAKCE POPTÁVKY DOMÁCNOSTÍ PO ENERGII NA ZVYŠOVÁNÍ ENERGETICKÉ ÚČINNOSTI: TEORIE A JEJÍ DŮSLEDKY PRO KONSTRUKCI EMPIRICKY OVĚŘITELNÝCH MODELŮ

REAKCE POPTÁVKY DOMÁCNOSTÍ PO ENERGII NA ZVYŠOVÁNÍ ENERGETICKÉ ÚČINNOSTI: TEORIE A JEJÍ DŮSLEDKY PRO KONSTRUKCI EMPIRICKY OVĚŘITELNÝCH MODELŮ RAKC POPTÁVKY DOMÁCNOTÍ PO NRGII NA ZVYŠOVÁNÍ NRGTICKÉ ÚČINNOTI: TORI A JJÍ DŮLDKY PRO KONTRUKCI MPIRICKY OVĚŘITLNÝCH MODLŮ tela Rubínová, Unverzta Karlova v Praze, Centrum pro otázky žvotního prostředí,

Více

VÝVOJ SOFTWARU NA PLÁNOVÁNÍ PŘESNOSTI PROSTOROVÝCH SÍTÍ PRECISPLANNER 3D. Martin Štroner 1

VÝVOJ SOFTWARU NA PLÁNOVÁNÍ PŘESNOSTI PROSTOROVÝCH SÍTÍ PRECISPLANNER 3D. Martin Štroner 1 VÝVOJ SOFWARU NA PLÁNOVÁNÍ PŘESNOSI PROSOROVÝCH SÍÍ PRECISPLANNER 3D DEVELOPMEN OF HE MEASUREMEN ACCURACY PLANNING OF HE 3D GEODEIC NES PRECISPLANNER 3D Martn Štroner 1 Abstract A software for modellng

Více

Specifikace, alokace a optimalizace požadavků na spolehlivost

Specifikace, alokace a optimalizace požadavků na spolehlivost ČESKÁ SPOLEČNOST PRO JAKOST Novotného lávka 5, 116 68 Praha 1 47. SEMINÁŘ ODBORNÉ SKUPINY PRO SPOLEHLIVOST pořádané výborem Odborné skupny pro spolehlvost k problematce Specfkace, alokace a optmalzace

Více

Optimalizační přístup při plánování rekonstrukcí vodovodních řadů

Optimalizační přístup při plánování rekonstrukcí vodovodních řadů Optmalzační přístup př plánování rekonstrukcí vodovodních řadů Ladslav Tuhovčák*, Pavel Dvořák**, Jaroslav Raclavský*, Pavel Vščor*, Pavel Valkovč* * Ústav vodního hospodářství obcí, Fakulta stavební VUT

Více

Metody zvýšení rozlišovací obrazů

Metody zvýšení rozlišovací obrazů XXVI. ASR '21 Semnar, Instruments and Control, Ostrava, Aprl 26-27, 21 Paper 7 Metody zvýšení rozlšovací obrazů BRADÁČ, Frantšek Ing., Ústav výrobních strojů, systémů a robotky, Vysoké učení techncké v

Více

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka

Více

HODNOCENÍ DODAVATELE SUPPLIER EVALUATION

HODNOCENÍ DODAVATELE SUPPLIER EVALUATION oční 6., Číslo IV., lstopad 20 HODNOCENÍ DODAVATELE SUPPLIE EVALUATION oman Hruša Anotace: Článe se zabývá hodnocením dodavatele pomocí scorng modelu, což znamená vanttatvní hodnocení dodavatele podle

Více

31 : : : : : 39

31 : : : : : 39 VLIV METALURGICKÝCH A TECHNOLOGICKÝCH PARAMETRŮ VÝROBY A ZPRACOVÁNÍ LOŽISKOVÝCH OCELÍ NA JEJICH MIKROSTRUKTURU APLIKACE SHLUKOVÉ ANALÝZY APPLYING CLUSTER ANALYSIS - METALLURGY AND TECHNOLOGICAL PARAMETERS

Více

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření

Více

XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29,

XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, XXX. ASR '2005 Semnar, Instruments and Control, Ostrava, Aprl 29, 2005 449 Usng flockng Algorthm and Vorono Dagram for Moton Plannng of a Swarm of Robots Plánování pohybu skupny robotů pomocí flockng algortmu

Více

Optimalizace metod pro multimediální aplikace v geodézii v prostředí IP sítí

Optimalizace metod pro multimediální aplikace v geodézii v prostředí IP sítí Acta Montanstca Slovaca Ročník 12 (2007), mmoradne číslo 3, 311-317 Optmalzace metod pro multmedální aplkace v geodéz v prostředí IP sítí Mlan Berka 1 Optmzaton of Methods for Geodetc Data for Multcast

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jří Holčík, CSc. INVESTICE Insttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a analýz IV - pokračování KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI METRIKY PRO URČENÍ VZDÁLENOSTI

Více

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má Tepelná kapacta C x = C V = ( ) dq ( ) du Dulong-Pettovo pravdlo: U = 3kT N C V = 3kN x V = T ( ) ds x Tepelná kapacta mřížky Osclátor s kvantovanou energí E n = ( n + 2) hν má střední hodnotu energe (po

Více

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova 6 461 17 Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

Hodnocení účinnosti údržby

Hodnocení účinnosti údržby Hodnocení účnnost ekonomka, pojmy, základní nástroje a hodnocení Náklady na údržbu jsou nutné k obnovení funkce výrobního zařízení Je potřeba se zabývat ekonomckou efektvností a hodnocením Je třeba řešt

Více

Mechatronické systémy s elektronicky komutovanými motory

Mechatronické systémy s elektronicky komutovanými motory Mechatroncké systémy s elektroncky komutovaným motory 1. EC motor Uvedený motor je zvláštním typem synchronního motoru nazývaný též bezkartáčovým stejnosměrným motorem (anglcky Brushless Drect Current

Více

VÝPOČET VELIKOSTNÍCH PARAMETRŮ KOMPOSTÁREN NA ZPEVNĚNÝCH PLOCHÁCH THE SIZE PARAMETER CALCULATION OF COMPOST PLANTS LOCALIZED ON COMPACTED AREAS

VÝPOČET VELIKOSTNÍCH PARAMETRŮ KOMPOSTÁREN NA ZPEVNĚNÝCH PLOCHÁCH THE SIZE PARAMETER CALCULATION OF COMPOST PLANTS LOCALIZED ON COMPACTED AREAS VÝPOČET VELIKOSTNÍCH PARAMETRŮ KOMPOSTÁREN NA ZPEVNĚNÝCH PLOCHÁCH THE SIZE PARAMETER CALCULATION OF COMPOST PLANTS LOCALIZED ON COMPACTED AREAS ALTMANN VLASTIMIL ), PLÍVA PETR 2) ) Česká zemědělská unverzta

Více

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně 9. Měření knetky dohasínání fluorescence ve frekvenční doméně Gavolův experment (194) zdroj vzorek synchronní otáčení fázový posun detektor Měření dob žvota lumnscence Frekvenční doména - exctace harmoncky

Více

Klasifikace Suffix Tree frázemi - srovnání s metodou Itemsets

Klasifikace Suffix Tree frázemi - srovnání s metodou Itemsets Klasifikace Suffix Tree frázemi - srovnání s metodou Itemsets Roman Tesař, Karel Ježek Katedra Informatiky a výpočetní techniky, Západočeská Univerzita v Plzni, Univezitní 8, 306 4, Plzeň {romant, jezek_ka}@kiv.zcu.cz

Více

Klasifikace a predikce. Roman LUKÁŠ

Klasifikace a predikce. Roman LUKÁŠ 1/28 Klasfkace a predkce Roman LUKÁŠ 2/28 Základní pomy Klasfkace = zařazení daného obektu do sté skupny na základě eho vlastností Dvě fáze klasfkace: I. Na základě trénovacích vzorů (u nchž víme, do aké

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

Metody vícekriteriálního hodnocení variant a jejich využití při výběru produktu finanční instituce

Metody vícekriteriálního hodnocení variant a jejich využití při výběru produktu finanční instituce . meznárodní konference Řízení a modelování fnančních rzk Ostrava VŠB-TU Ostrava, Ekonomcká fakulta, katedra Fnancí 8. - 9. září 200 Metody vícekrterálního hodnocení varant a ech využtí př výběru produktu

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

Řešení radiační soustavy rovnic

Řešení radiační soustavy rovnic Řešení radační soustavy rovnc 1996-2016 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ RadSoluton 2016 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca 1 / 23 Soustava lneárních

Více

Numerické metody optimalizace

Numerické metody optimalizace Numercké metody optmalzace Numercal optmzaton methods Bc. Mloš Jurek Dplomová práce 2007 Abstrakt Abstrakt česky Optmalzační metody představují vyhledávání etrémů reálných funkcí jedné nebo více reálných

Více

MODELOVÁNÍ SEISMICKÉHO ZDROJE JAKO REÁLNÁ TESTOVACÍ ÚLOHA PRO NELINEÁRNÍ INVERSNÍ ALGORITMUS

MODELOVÁNÍ SEISMICKÉHO ZDROJE JAKO REÁLNÁ TESTOVACÍ ÚLOHA PRO NELINEÁRNÍ INVERSNÍ ALGORITMUS MODELOVÁNÍ SEISMICKÉHO ZDROJE JAKO REÁLNÁ TESTOVACÍ ÚLOHA PRO NELINEÁRNÍ INVERSNÍ ALGORITMUS P. Kolář, B. Růžek, P. Adamová Geofyzkální ústav AV ČR, Praha Abstrakt Pro vyvíjený nelneární nversní algortmus

Více

HODNOCENÍ DOJÍŽĎKY DO ZAMĚSTNÁNÍ V MORAVSKOSLEZSKÉM KRAJ

HODNOCENÍ DOJÍŽĎKY DO ZAMĚSTNÁNÍ V MORAVSKOSLEZSKÉM KRAJ HODNOCENÍ DOJÍŽĎKY DO ZAMĚSTNÁNÍ V MORAVSKOSLEZSKÉM KRAJ Jří HORÁK, Jan TESLA, Igor IVAN,, Insttut Geonformatky, HGF, VŠB-TU Ostrava, 7. lstopadu 5, 708 Ostrava, Česká republka jr.horak@vsb.cz, jan.tesla@vsb.cz,

Více

ČVUT FEL. X16FIM Finanční Management. Semestrální projekt. Téma: Optimalizace zásobování teplem. Vypracoval: Marek Handl

ČVUT FEL. X16FIM Finanční Management. Semestrální projekt. Téma: Optimalizace zásobování teplem. Vypracoval: Marek Handl ČVUT FEL X16FIM Fnanční Management Semestrální projekt Téma: Optmalzace zásobování teplem Vypracoval: Marek Handl Datum: květen 2008 Formulace úlohy Pro novou výstavbu 100 bytových jednotek je třeba zvolt

Více

FORANA. 1. Úvod. 2 Vznik akustického signálu řeči v mluvidlech. Pavel GRILL 1, Jana TUČKOVÁ 2

FORANA. 1. Úvod. 2 Vznik akustického signálu řeči v mluvidlech. Pavel GRILL 1, Jana TUČKOVÁ 2 FORANA Pavel GRILL 1, Jana TUČKOVÁ 2 České vysoké učení techncké v Praze, Fakulta elektrotechncká, Katedra teore obvodů Abstrakt Jedním z příznaků vývojové dysfáze je částečná porucha tvorby a porozumění

Více

POLYMERNÍ BETONY Jiří Minster Ústav teoretické a aplikované mechaniky AV ČR, v. v. i.

POLYMERNÍ BETONY Jiří Minster Ústav teoretické a aplikované mechaniky AV ČR, v. v. i. Odborná skupna Mechanka kompoztních materálů a konstrukcí České společnost pro mechanku s podporou frmy Letov letecká výroba, s. r. o. a Ústavu teoretcké a aplkované mechanky AV ČR v. v.. Semnář KOMPOZITY

Více

Modelování elektrických sítí KEE/MS Přednáška na téma: Výpočty chodu sítě. Ing. Jan Veleba, Ph.D. doc. Ing. Karel Noháč, Ph.D.

Modelování elektrických sítí KEE/MS Přednáška na téma: Výpočty chodu sítě. Ing. Jan Veleba, Ph.D. doc. Ing. Karel Noháč, Ph.D. Modelování elektrckých sítí KEE/MS Přednáška na téma: Výpočty chodu sítě Ing. Jan Veleba, Ph.D. doc. Ing. Karel Noháč, Ph.D. Výpočet chodu soustavy Výpočet chodu soustavy Výpočet chodu soustavy Výpočet

Více

Simulační metody hromadné obsluhy

Simulační metody hromadné obsluhy Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Šroubové kompresory. Řada MSL 2,2-15 kw. Jednoduché a kompletní řešení pro Vaší potřebu stlačeného vzduchu

Šroubové kompresory. Řada MSL 2,2-15 kw. Jednoduché a kompletní řešení pro Vaší potřebu stlačeného vzduchu Šroubové kompresory Řada MSL 2,2-15 kw Jednoduché a kompletní řešení pro Vaší potřebu stlačeného vzduchu CHYTRÉ TECHNICKÉ ŘEŠENÍ Nžší náklady na údržbu a prodloužené servsní ntervaly Velce jednoduchá konstrukce

Více

HUDEBNÍ EFEKT DISTORTION VYUŽÍVAJÍCÍ ZPRACOVÁNÍ PŘÍRŮSTKŮ SIGNÁLŮ ČASOVĚ

HUDEBNÍ EFEKT DISTORTION VYUŽÍVAJÍCÍ ZPRACOVÁNÍ PŘÍRŮSTKŮ SIGNÁLŮ ČASOVĚ HUDEBÍ EFEKT DISTORTIO VYUŽÍVAJÍCÍ ZPRACOVÁÍ PŘÍRŮSTKŮ SIGÁLŮ ČASOVĚ VARIATÍM SYSTÉMEM Ing. Jaromír Mačák Ústav telekomunkací, FEKT VUT, Purkyňova 118, Brno Emal: xmacak04@stud.feec.vutbr.cz Hudební efekt

Více

Digitální přenosové systémy a účastnické přípojky ADSL

Digitální přenosové systémy a účastnické přípojky ADSL ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechncká LABORATORNÍ ÚLOHA Č. 2 Dgtální přenosové systémy a účastncké přípojky ADSL Vypracoval: Jan HLÍDEK & Lukáš TULACH V rámc předmětu: Telekomunkační

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Validation of the selected factors impact on the insured accident

Validation of the selected factors impact on the insured accident 6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Valdaton of the selected factors mpact on the

Více

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

1.2. Postup výpočtu. , [kwh/(m 3.a)] (6)

1.2. Postup výpočtu. , [kwh/(m 3.a)] (6) 1. Stavebn energetcké vlastnost budov Energetcké chování budov v zním období se v současné době hodnotí buď s pomocí průměrného součntele prostupu tepla nebo s pomocí měrné potřeby tepla na vytápění. 1.1.

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO

PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO MAPOVÁNÍ WEBOVÝCH STRÁNEK ŘIMNÁČ MARTIN 1, ŠUSTA RICHARD 2, ŽIVNŮSTKA JIŘÍ 3 Katedra řídcí technky, ČVUT-FEL, Techncká 2, Praha 6, tel. +42 224 357 359, fax. +

Více

MOŽNOSTI PREDIKCE DYNAMICKÉHO CHOVÁNÍ LOPAT OBĚŽNÝCH KOL KAPLANOVÝCH A DÉRIAZOVÝCH TURBÍN.

MOŽNOSTI PREDIKCE DYNAMICKÉHO CHOVÁNÍ LOPAT OBĚŽNÝCH KOL KAPLANOVÝCH A DÉRIAZOVÝCH TURBÍN. MOŽNOSTI PREDIKCE DYNAMICKÉHO CHOVÁNÍ LOPAT OBĚŽNÝCH KOL KAPLANOVÝCH A DÉRIAZOVÝCH TURBÍN. Mroslav VARNER, Vktor KANICKÝ, Vlastslav SALAJKA ČKD Blansko Strojírny, a. s. Anotace Uvádí se výsledky teoretckých

Více