Prohledávání dokumentů ve vektorovém modelu
|
|
- Robert Beránek
- před 6 lety
- Počet zobrazení:
Transkript
1 Prohledávání dokumentů ve vektorovém modelu Pavel Moravec 1 Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, , Ostrava-Poruba pavel.moravec@vsb.cz Abstrakt. Information retrieval se mj. zabývá ukládáním a prohledáváním dokumentů. Vektorový model reprezentuje dokument jako vektor mnohorozměrného prostoru. Většina jeho implementací je bohužel efektivní jen pro malé dimenze, proto jsou hledány metody, jak dimenzi vektorů dokumentů snížit. V tomto článku ukazujeme jednu z možností využití signatur (bitových řetězců pevné délky) které byly v boolovském modelu velmi efektivní. Druhou významnou skupinu metod tvoří indexování latentní sémantiky (LSI ), jehož výpočetní náročnost je ovšem vysoká. Proto byla navržena rychlejší metoda náhodných projekcí, dobře zachovávající (při dostatečně velké redukované dimenzi) vzdálenosti a úhly mezi vektory. V článku zmíníme výsledky metody ve vektorovém modelu. Úvod Dokumentografické informační systémy (DIS) ukládají textové (či multimediální) dokumenty a umožňují v nich vyhledávat. Při zpracování textových dokumentů v těchto systémech ukládáme celá slova (nebo fráze), obsažená v dokumentu termy. Existuje více způsobů, jak termy v dokumentech reprezentovat. Nejčastěji používaným modelem je tzv. boolovský (boolský) model [17], který umožňuje vyhodnocovat dotazy na termy, obsažené v dokumentech, či jejich spojení, určená pomocí logických operátorů. Pokud však dokument přesně nesplňuje podmínku, obsaženou v dotazu, není nalezen. Naproti tomu vektorový model [15], v němž je kolekce dokumentů reprezentována maticí termů v dokumentech, nám umožní vyhledávat i dokumenty, které obsahují dostatečné množství termů, obsažených v dotaze. Zavádí také systém vah termů, které určují významnost termu v rámci dokumentu a kolekce. Vektorový model nám také umožňuje seřadit dokumenty, získané jako odpověď na zadaný dotaz na základě míry podobnosti s dotazem; některé metody hledají zadaný počet nejbližších dokumentů. U rozsáhlejších kolekcí narůstá čas potřebný k vyhodnocení dotazu s rostoucím počtem termů a dokumentů. Existují proto mnohé přístupy, jak omezit počet porovnávaných vektorů. Nejčastěji jde o stromové struktury jako jsou R-stromy [10], M-stromy, kd-stromy, pyramidová schémata [7] a mnohé další. U těchto struktur ovšem narážíme na problém označovaný jako prokletí dimensionality. V jeho důsledku se s rostoucí dimenzí stávají zmíněné stromové 1 Školitel Doc. RNDr. Václav Snášel, CSc. (vaclav.snasel@vsb.cz).
2 struktury méně efektivní a rychlost vyhledávání bývá od určité dimenze horší než v případě sekvenčního průchodu celou kolekcí. Snažíme se proto snížit alespoň celkový počet termů, určující dimenzi prostoru dokumentů. K tomuto účelu lze využít algebraických metod, souhrnně označovaných jako indexování latentní sémantiky Latent Semantic Indexing (LSI ) nebo techniky náhodných projekcí. Můžeme také tyto metody spojit a dosáhnout tak zrychlení výpočtu za cenu nižší přesnosti oproti LSI samotnému. Druhou možností je vytvořit kratší řetězec hodnot, popisující původní vektor a použít jej k filtraci části nerelevantních dokumentů před vyhodnocením dotazu, čehož využívají signaturové metody [9,14] a VA-files [6]. Abychom mohli vyhodnotit kvalitu metod, zmenšujících dimenzi prostoru dokumentů, musíme být schopni popsat chybu, která projekcí do nižší dimenze vznikne. Toho dosahujeme buď měřením rozdílu vzdáleností mezi termy v původním a redukovaném prostoru, nebo zavedením koeficientů přesnosti (precission) a úplnosti (recall) [4]. Srovnání můžeme provést vůči původnímu prostoru, nebo vůči předem známým závislostem mezi dokumenty. Přesností rozumíme podíl relevantních dokumentů v nalezených, úplností poměr nalezených relevantních dokumentů a všech relevantních dokumentů. Ideální je situace, kdy by oba tyto koeficienty byly rovny 1. V první kapitole stručně popíši vektorový model, ve druhé využití signaturových metod ve vektorovém modelu, ve třetí bude zmíněn přínos náhodných projekcí a ve čtvrté dosud provedené experimenty. 1 Vektorový model v DIS Vektorový model reprezentuje dokumenty, obsažené v kolekci, jako vektory v n- rozměrném vektorovém prostoru R n, kde n je počet všech různých termů v kolekci. Dokument D j je reprezentován jako vektor d j = (w j,1, w j,2,..., w j,n ). Obdobně dotaz Q je reprezentován jako vektor q = (w q,1, w q,2,..., w q,n ). Je zřejmé, že dotazem může být i samotný dokument, je tedy možno hledat všechny dokumenty, které se dostatečně podobají vybranému. Složky w j,i určují váhu termu i v dokumentu j. Termy, které nejsou v dokumentu obsaženy mají nulovou váhu. Zbývající váhy termů jsou vypočteny na základě součinu následujících tří složek [16]: 1. Frekvence termu v dokumentu zohledňuje, kolikrát je daný term obsažen v konkrétním dokumentu; nejčastěji jde přímo o počet výskytů termu v dokumentu (tf ). 2. Frekvence termu v kolekci významnost termu pro rozlišení dokumentů; obvykle log(m/m) označovaná jako inverzní frekvence dokumentu (idf, kde M je počet dokumentů, obsahujících term a m počet všech dokumentů.
3 3. Normalizace váhy termu případná normalizace složek vektorů dokumentů během výpočtu vah termů. Při dotazování hledáme vektory dokumentů, které jsou dostatečně blízké vektoru dotazu. Euklidovská vzdálenost s oblibou používaná při dotazování nad obrazovými daty je v DIS většinou nahrazena koeficientem podobnosti, založeným na euklidovském skalárním součinu. Nebyly-li vektory předem normovány, je koeficient podobnosti definován jako δ(d j, q) = d j q d j q V opačném případě postačí δ(d j, q) = d j q = n (w j,i, w q,i ) Jako relevantní označíme dokumenty, které splňují podmínku δ(d j, q) t, kde t určuje minimální hodnotu koeficientu podobnosti mezi vektorem dokumentu a dotazu. Výsledné dokumenty lze na základě koeficientu podobnosti seřadit a nabídnout je uživateli od nejvíce odpovídajícího. Vektory termů v dokumentech jsou často uloženy nebo reprezentovány ve formě řídké matice termů v dokumentech (term-by-document matrix). Tato matice m n obsahuje řádkové vektory dokumentů d 1,..., d m, vymezující váhy termů, obsažených v dokumentu a sloupcové vektory termů t 1,..., t n, určující dokumenty, obsahující daný term. 2 Signatury ve vektorovém modelu Signatura je bitovým vektorem délky F. Přítomnost termu v dokumentu je indikována nastavením m bitů (jejichž pozice je určena hashovací funkcí) na 1. Počet nenulových bitů v signatuře je nazýván váhou signatury. Signaturu dokumentu lze vytvořit buď zřetězením signatur termů (vzniklá signatura je velmi dlouhá) nebo zvrstvením více signatur: S D = k i=1 S T i, kde S T 1,..., S T k jsou signatury všech termů T 1,..., T k, obsažených v dokumentu D. Lze také tyto dva přístupy kombinovat rozdělit text do bloků (stejné délky či váhy), vypočíst vrstvené signatury jednotlivých bloků a tyto zřetězit. Při použití signatur v boolovském modelu jsou před vyhodnocením konjunktivního dotazu nejprve porovnány signatury termů S Qj, obsažené v dotaze (nebo zvrstvená signatura S Q = j S Q j, má-li dokument jedinou zvrstvenou signaturu) se signaturami dokumentů S Di. Platí-li podmínka ( j)[s Di S Qj = S Qj ], může dokument zvolené termy obsahovat. Tuto situaci nazýváme hit. Protože hashovací funkce a vrstvení nejsou prostými funkcemi, můžeme takto nalézt i dokumenty, které hledané termy neobsahují. Tuto situaci nazveme falešným hitem. Proto by po porovnání signatur mělo následovat porovnání nalezených dokumentů s dotazem, které falešné hity odstraní. Zatímco v boolovském modelu tento přístup funguje velmi dobře, u vektorového modelu selhává. Podmínka ( j)[s Di S Qj = S Qj ] ve vektorovém modelu obecně neplatí, proto musíme hledat jiné přístupy. i=1
4 Očekávání, že relevantním bude dokument, v jehož signaturách bude nalezeno alespoň k% signatur dotazu nám nezajistí, že některé relevantní dokumenty nebudou vypuštěny. Navíc nejsou brány v potaz váhy termů, proto počet falešných hitů prudce stoupá s klesající hodnotou k. Existuje však řešení - Soubory signatur, rozdělené dle vah (Weight-partitioned signature files WPSF ), navržené v [12]. Termy jsou podle frekvence (tf) resp. vah termů v dokumentu rozděleny do skupin tzv. TF-groups. Pro každou z těchto skupin je vytvořen jeden soubor signatur a v každém souboru jsou uloženy signatury bloků jednotlivých dokumentů. Při hledání jsou pak tyto soubory procházeny v pořadí od největší hodnoty tf po nejmenší H-L průchod (resp. naopak L-H průchod), dokud není signatura termu pro daný dokument nalezena. Váha termu je pak spočtena na základě souboru signatur, kde byl hledaný term nalezen a hodnoty idf; na základě vah všech nalezených termů je poté spočítána hodnota δ(d j, q). Pravděpodobnost falešného hitu je předem minimalizována na základě vzorku dokumentů nebo očekávaných vlastností kolekce jsou pro jednotlivé soubory signatur vypočteny vhodné délky bloků a signatur a váha signatury termu. Nevadí-li nám nižší přesnost, způsobená falešnými hity, je možno použít získaných výsledků přímo, bez nutnosti dodatečného výpočtu koeficientu podobnosti mezi vektorem dotazu a vektory nalezených dokumentů. Protože WPSF byly procházeny sekvenčním průchodem, navrhli jsme v [1] rychlejší metodu průchodu soubory signatur, založenou na S-stromu [8], modifikaci B + -stromu, která při vkládání minimalizuje nárůst váhy signatur v uzlech celé stromové struktury. Vyhledávání pokračuje jen do uzlů, jejichž signatury S Nk splňují podmínku S Q S Nk = S Q. 3 Redukce dimenze náhodnou projekcí Druhým způsobem, jak snížit čas potřebný pro porovnání je snížení dimenze prostoru dokumentů. Toho lze dosáhnout vypuštěním některých termů, avšak na úkor přesnosti a úplnosti. Proto redukujeme dimenzi jinými způsoby. Nejznámější metodou je latentní sémantické indexování (LSI ), při němž v většinou počítáme k-redukovaný singulární rozklad matice termů v dokumentech (metoda SVD). Kromě redukce dimenze, při níž je výsledná chyba nejmenší možná, získáme navíc tzv. latentní sémantiku dokumenty týkající se stejné tématické oblasti si budou blíže a vyniknou vztahy mezi významově (sémanticky) podobnými termy. Bohužel současné metody výpočtu LSI jsou výpočetně náročné i rychlá metoda Lanczos [11] má časovou složitost O(mnc), kde c je průměrný počet různých termů v dokumentu. Proto byly hledány rychlejší metody, které by dosahovaly podobných výsledků za cenu horší chyby aproximace. Jednou z těchto metod je náhodná projekce [5], která při dostatečně vysoké redukované dimenzi d, d << n dobře zachovává vzdálenosti a úhly mezi vektory. Náhodná projekce je založena na násobení matice termů v dokumentech maticí náhodné projekce R. Prvky R jsou náhodná čísla, jejichž distribuce má nulovou střední hodnotu a jednotkový rozptyl nejčastěji N(0, 1) a Achlioptasem navržené distribuce { 3, 0, + 3}
5 2 s pravděpodobnostmi 3 pro 0 a 1 6 pro 3, a 3 a { 1, +1}, obě hodnoty s pravděpodobností 1 2 (poskytuje o něco horší výsledky než předchozí metody). Testy ukazují, že např. pro m = a d 500 jsou přesnost i úplnost velmi dobré a pohybují se nad 90%. Časová složitost náhodných projekcí je nižší než u LSI O(cdn), ale výsledné vektory dokumentů již nejsou řídké, nezískáme latentní sémantiku a redukovaná dimenze není natolik malá, aby překonala prokletí dimenze. Je ale možno použít náhodné projekce jako předstupně LSI pak dochází k rychlejšímu výpočtu singulárního rozkladu, časová složitost je O(m(log 2 n + c log n)) [13] a výsledný rozklad velmi dobře aproximuje rozklad, získaný přímým výpočtem LSI. 4 Provedené experimenty V rámci testů signaturových metod jsem implementoval klasické signatury, S- stromy a WPSF vylepšené S-stromy. Výsledky testů s těmito strukturami, včetně testů klasických signatur a signatur termů s váhou závislou na frekvenci termu v dokumentu jsou shrnuty v [1]. Obecný popis těchto metod byl obsahem jedné z kapitol [2]. Dále bylo testováno chování VA-files při použití euklidovského skalárního součinu pro rozsahové dotazy namísto klasické euklidovské vzdálenosti. Vzhledem k neuspokojivým výsledkům nebyly tyto publikovány. Další oblast zkoumání se týkala implementace a testů náhodných projekcí, a míry zkreslení, které přináší jejich použití vzhledem k neredukovanému prostoru. První výsledky jsou shrnuty v [3]. Další získané výsledky, srovnávající LSI a náhodné projekce následované LSI nebyly dosud publikovány. Závěr Oblast IR a vektorový model představují zajímavou oblast pro další výzkum. Efektivní implementace vektorového modelu pro rozsáhlé kolekce je dosud hledána a jsou stále zveřejňovány nové metody, jak vyhledávání urychlit. Zajímavými se z tohoto hlediska jeví možnost implementace dostatečně rychlého řešení singulárního rozkladu matice, které by umožnilo redukovat dimenzi velkých kolekcí a nové vylepšené indexační struktury, poskytující rychlejší odezvu, jakými by mohly být například iminmax a idistance [18], které v současné době implementuji. Reference 1. P. Moravec, J. Pokorný, and V. Snášel. Vector query with signature filtering. Proceedings of 6th BIS conference, Colorado Springs, USA, T. Skopal, P. Moravec, M. Krátký, V. Snášel, and J. Pokorný. An Efficient Implementation of the Vector Model in Information Retrieval. Accepted at RCDL 03 Conference, St. Petersburg, Russia, 2003.
6 3. P. Moravec, M. Krátký, and V. Snášel. Random Projections for Dimension Reduction in Information Retrieval Systems. Proceedings of IMAMM 03 Conference, R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley, New York, E. Bingham and H. Mannila. Random projection in dimensionality reduction: applications to image and text data. In Knowledge Discovery and Data Mining, pages , S. Blott and R. Weber. An Approximation-Based Data Structure for Similarity Search. Technical report, ESPRIT, C. Böhm, S. Berchtold, and D. Keim. Searching in High-Dimensional Spaces Index Structures for Improving the Performance of Multimedia Databases. ACM Computing Surveys, 33(3): , U. Deppisch. S-tree: A Dynamic Balanced Signature Index for Office Retrieval. In Proc. of ACM Research and Development in Information Retrieval, pages 77 87, C. Faloutsos. Signature-based text retrieval methods, a survey. IEEE Computer society Technical Committee on Data Engineering, 13(1):25 32, A. Guttman. R-Trees: A Dynamic Index Structure for Spatial Searching. In Proceedings of ACM SIGMOD 1984, Annual Meeting, Boston, USA, pages ACM Press, June R. M. Larsen. Lanczos bidiagonalization with partial reorthogonalization. Technical report, University of Aarhus, D. L. Lee and L. Ren. Document Ranking on Weight-Partitioned Signature Files. In ACM TOIS 14, pages , C. H. Papadimitriou, H. Tamaki, P. Raghavan, and S. Vempala. Latent semantic indexing: A probabilistic analysis. pages , C. Roberts. Partial-match retrieval via method of superimposed codes. In Proceedings of IEEE 67, volume 12, pages , G. Salton. The SMART Retrieval System Experiments in Automatic Document Processing. Prentice Hall Inc., Englewood Clifs, G. Salton and C. Buckley. Term weighting approaches in automatic text retrieval. Information Processing and Management, 24(5): , G. Salton and G. McGill. Introduction to Modern Information Retrieval. McGrawill, C. Yu. High-Dimensional Indexing. Springer Verlag, LNCS 2341, Annotation. Information retrieval deals with storage and retrieval of documents. Vector model represents the document as a vector in high-dimensional space. Because the majority of vector model s implementations is efficient only for smaller dimensions, methods for document vectors reduction have been studied. We have suggested in this article one of the possibilities the usage of signatures (i.e. bit strings of given length), which are known to be very efficient in Boolean model. Second important category of reduction methods is called latent semantic indexing (LSI ). Since LSI is quite hard to calculate, a faster reduction method random projection, well preserving distances and angles between vectors (is the reduced dimension high enough) was proposed recently. We have studied its impact in the vector model.
Metrické indexování vektorových modelů v oblasti information retrieval
Metrické indexování vektorových modelů v oblasti information retrieval Tomáš Skopal Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba Tomas.Skopal@vsb.cz
Geometrické indexování a dotazování multimediálních dat
Geometrické indexování a dotazování multimediálních dat Tomáš Skopal, Michal Krátký, Václav Snášel Katedra informatiky, VŠB-Technická Univerzita Ostrava 17. listopadu 15, 708 33 Ostrava-Poruba {michal.kratky,
Využití SVD pro indexování latentní sémantiky
Využití SVD pro indexování latentní sémantiky Michal Krátký 1 Department of Computer Science, VŠB-Technical University of Ostrava, Czech Republic michal.kratky@vsb.cz Abstrakt Zpracováváním velkého množství
Datové struktury. Zuzana Majdišová
Datové struktury Zuzana Majdišová 19.5.2015 Datové struktury Numerické datové struktury Efektivní reprezentace velkých řídkých matic Lze využít při výpočtu na GPU Dělení prostoru a binární masky Voxelová
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY
ROBUST 2004 c JČMF 2004 SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY Dušan Húsek, Hana Řezanková, Václav Snášel Klíčová slova: Výpočetní statistika, shlukování, rozsáhlé datové soubory, dokumentografické informační
Vícerozměrný přístup pro netriviální vyhledávání termů
Vícerozměrný přístup pro netriviální vyhledávání termů Michal Krátký, Tomáš Skopal, Václav Snášel Katedra informatiky, FEI, VŠB Technická univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz
Singulární rozklad aplikace v image deblurring
Singulární rozklad aplikace v image deblurring M. Plešinger, Z. Strakoš TUL, Fakulta mechatroniky, Liberec AV ČR, Ústav informatiky, Praha 1 Úvod Uvažujme obecnou reálnou matici Pak existuje rozklad A
Experimentální systém pro WEB IR
Experimentální systém pro WEB IR Jiří Vraný Školitel: Doc. RNDr. Pavel Satrapa PhD. Problematika disertační práce velmi stručný úvod WEB IR information retrieval from WWW, vyhledávání na webu Vzhledem
Moderní metody vyhledávání dokumentů v rozsáhlých plnotextových databázích : příklad vektorového modelu
Moderní metody vyhledávání dokumentů v rozsáhlých plnotextových databázích : příklad vektorového modelu Petr Houdek 1, Josef Schwarz 2, Václav Snášel 3 1 Parlamentní knihovna, Sněmovní 4, Praha houdek@psp.cz
Vyhledávání podle klíčových slov v relačních databázích. Dotazovací jazyky I ZS 2010/11 Karel Poledna
Vyhledávání podle klíčových slov v relačních databázích Dotazovací jazyky I ZS 2010/11 Karel Poledna Vyhledávání podle klíčových slov Uživatel zadá jedno nebo více slov a jsou mu zobrazeny výsledky. Uživatel
Využití LSI a M-stromu při indexování a vyhledávání obrázků
Využití LSI a M-stromu při indexování a vyhledávání obrázků Tomáš Skopal 1, Michal Kolovrat 2 a Václav Snášel 2 1 Katedra softwarového inženýrství, MFF UK Praha, Malostranské nám. 25, 118 00, Praha 2 Katedra
k-dimenzionálním prostoru. problém: Zkonstruovat strom, který rozděluje prostor polorovinami
kd-stromy (kd-trees) k čemu to je: ukládání vícerozměrných dat (k-dimenzionální data) vstup: Množina bodů (nebo složitějších geometrických objektů) v k-dimenzionálním prostoru. problém: Zkonstruovat strom,
Efektivní vyhledávání v kolekcích obrázků tváří
Efektivní vyhledávání v kolekcích obrázků tváří Michal KRÁTKÝ, Tomáš SKOPAL, Václav SNÁŠEL Katedra informatiky, VŠB-Technická univerzita Ostrava 17. listopadu 15, 708 33 Ostrava {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz
Uni- and multi-dimensional parametric tests for comparison of sample results
Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Automatická oprava textu v různých jazycích
Automatická oprava textu v různých jazycích Bc. Petr Semrád, doc. Ing. František Dařena Ph.D., Ústav informatiky, Provozně ekonomická fakulta, Mendelova univerzita v Brně, xsemrad@mendelu.cz, frantisek.darena@mendelu.cz
Datové struktury 2: Rozptylovací tabulky
Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Vizualizace v Information Retrieval
Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby
Lineární algebra - I. část (vektory, matice a jejich využití)
Lineární algebra - I. část (vektory, matice a jejich využití) Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 2. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 40 Obsah 1 Vektory
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
DEFINICE Z LINEÁRNÍ ALGEBRY
DEFINICE Z LINEÁRNÍ ALGEBRY Skripta Matematické metody pro statistiku a operační výzkum (Nešetřilová, H., Šařecová, P., 2009). 1. definice Vektorovým prostorem rozumíme neprázdnou množinu prvků V, na které
Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů
Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů
Tvorba informačních systémů 1/18 Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2008/2009 Tvorba informačních systémů 2/18 Úvod
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 12. září 2016 Jiří Dvorský (VŠB TUO) Vyhledávání 201 / 344 Osnova přednášky
Kouzlo Fibonacciho kódování
Kouzlo Fibonacciho kódování Václav Snášel, Jiří Bouchala, Petr Vodstrčil, Ostrava Abstrakt. V článku se budeme zabývat Fibonacciho kódováním, které je díky proměnlivé délce kódu vhodnější (obzvláště pro
Metody analýzy dat I. Míry a metriky - pokračování
Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Základy matematiky pro FEK
Základy matematiky pro FEK 2. přednáška Blanka Šedivá KMA zimní semestr 2016/2017 Blanka Šedivá (KMA) Základy matematiky pro FEK zimní semestr 2016/2017 1 / 20 Co nás dneska čeká... Závislé a nezávislé
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Úvod do kvantového počítání
2. přednáška Katedra počítačů, Fakulta elektrotechnická České vysoké učení technické v Praze 17. března 2005 Opakování Část I Přehled z minulé hodiny Opakování Alternativní výpočetní modely Kvantové počítače
Numerické metody a programování
Projekt: Inovace výuky optiky se zaměřením na získání experimentálních dovedností Registrační číslo: CZ.1.7/2.2./28.157 Numerické metody a programování Lekce 4 Tento projekt je spolufinancován Evropským
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie
Evoluční strategie Navrženy v 60. letech jako experimentální optimalizační metoda Založena na reálných číslech Velice rychlá s dobrou podporou teorie Jako první zavedla self-adaptation (úpravu sebe sama)
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
Numerické metody a programování. Lekce 4
Numerické metody a programování Lekce 4 Linarní algebra soustava lineárních algebraických rovnic a 11 a 12 x 2 a 1, N x N = b 1 a 21 a 22 x 2 a 2, N x N = b 2 a M,1 a M,2 x 2 a M,N x N = b M zkráceně A
řešeny numericky 6 Obyčejné diferenciální rovnice řešeny numericky
řešeny numericky řešeny numericky Břetislav Fajmon, UMAT FEKT, VUT Brno Na minulé přednášce jsme viděli některé klasické metody a přístupy pro řešení diferenciálních rovnic: stručně řečeno, rovnice obsahující
Reranking založený na metadatech
České vysoké učení technické v Praze Fakulta informačních technologií Katedra softwarového inženýrství Reranking založený na metadatech MI-VMW Projekt IV - 1 Pavel Homolka Ladislav Kubeš 6. 12. 2011 1
Alternativní přístup k analýze vícefaktorových dat
Alternativní přístup k analýze vícefaktorových dat Kamila Fačevicová 1, Peter Filzmoser 2, Karel Hron 1 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta Univerzity Palackého
Návrh Designu: Radek Mařík
1. 7. Najděte nejdelší rostoucí podposloupnost dané posloupnosti. Použijte metodu dynamického programování, napište tabulku průběžných délek částečných výsledků a tabulku předchůdců. a) 5 8 11 13 9 4 1
Zobrazování barev. 1995-2015 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/
Zobrazování barev 1995-2015 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ ColorRep 2015 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1 / 18 Barevné schopnosti HW True-color
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Transformace obrazu Josef Pelikán KSVI MFF UK Praha
Transformace obrazu 99725 Josef Pelikán KSVI MFF UK Praha email: Josef.Pelikan@mff.cuni.cz WWW: http://cgg.ms.mff.cuni.cz/~pepca/ Transformace 2D obrazu dekorelace dat potlačení závislosti jednotlivých
Matematika pro geometrickou morfometrii
Matematika pro geometrickou morfometrii Václav Krajíček Vaclav.Krajicek@mff.cuni.cz Department of Software and Computer Science Education Faculty of Mathematics and Physics Charles University Přednáška
Poslední nenulová číslice faktoriálu
Poslední nenulová číslice faktoriálu Kateřina Bambušková BAM015, I206 Abstrakt V tomto článku je popsán a vyřešen problém s určením poslední nenulové číslice faktoriálu přirozeného čísla N. Celý princip
Klasifikace webových stránek na základě vizuální podoby a odkazů mezi dokumenty
Klasifikace webových stránek na základě vizuální podoby a odkazů mezi dokumenty Petr Loukota, Vladimír Bartík Ústav informačních systémů, Fakulta informačních technologií VUT v Brně, Česká republika iloukota@fit.vutbr.cz,
Arnoldiho a Lanczosova metoda
Arnoldiho a Lanczosova metoda 1 Částečný problém vlastních čísel Ne vždy je potřeba (a někdy to není ani technicky možné) nalézt celé spektrum dané matice (velké řídké matice). Úloze, ve které chceme aproximovat
Tvorba informačních systémů
Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2006/2007 c 2006 2008 Michal Krátký Tvorba informačních systémů 1/17 Úvod XML
Dobývání znalostí z textů text mining
Dobývání znalostí z textů text mining Text mining - data mining na nestrukturovaných textových dokumentech 2 možné přístupy: Předzpracování dat + běžné algoritmy pro data mining Speciální algoritmy pro
Selected article from Tento dokument byl publikován ve sborníku
Selected article from Tento dokument byl publikován ve sborníku Nové metody a postupy v oblasti přístrojové techniky, automatického řízení a informatiky 2018 New Methods and Practices in the Instrumentation,
Kapitola 11: Vektory a matice:
Kapitola 11: Vektory a matice: Prostor R n R n = {(x 1,, x n ) x i R, i = 1,, n}, n N x = (x 1,, x n ) R n se nazývá vektor x i je i-tá souřadnice vektoru x rovnost vektorů: x = y i = 1,, n : x i = y i
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
Michal Krátký, Miroslav Beneš
Databázové a informační systémy Michal Krátký, Miroslav Beneš Katedra informatiky VŠB Technická univerzita Ostrava 5.12.2005 2005 Michal Krátký, Miroslav Beneš Databázové a informační systémy 1/24 Obsah
Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.
1/ 13 Klepnutím lze upravit styl předlohy Klepnutím lze upravit styl předlohy www.splab.cz Soft biometric traits in de identification process Hair Jiri Prinosil Jiri Mekyska Zdenek Smekal 2/ 13 Klepnutím
dat Robust ledna 2018
Analýza prostorově závislých funkcionálních dat V. Římalová, A. Menafoglio, A. Pini, E. Fišerová Robust 2018 25. ledna 2018 Motivace Data a náhled lokace Měsíční měření (březen-říjen 2015 a 2016) 5 chemických
příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.
Několik řešených příkladů do Matematiky Vektory V tomto textu je spočteno několik ukázkových příkladů které vám snad pomohou při řešení příkladů do cvičení. V textu se objeví i pár detailů které jsem nestihl
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci OBSAH A CÍLE SEMINÁŘE: Opakování a procvičení vybraných
Všechno, co jste kdy chtěli vědět o maticích, ale báli jste se zeptat
Všechno, co jste kdy chtěli vědět o maticích, ale báli jste se zeptat Čtvercová matice n n, např. může reprezentovat: A = A A 2 A 3 A 2 A 22 A 23 A 3 A 32 A 33 matici koeficientů soustavy n lineárních
Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
Robust 2014, 19. - 24. ledna 2014, Jetřichovice
K. Hron 1 C. Mert 2 P. Filzmoser 2 1 Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta, Univerzita Palackého, Olomouc 2 Department of Statistics and Probability Theory Vienna University
Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n
[1] Základní pojmy [2] Matice mezi sebou sčítáme a násobíme konstantou (lineární prostor) měníme je na jiné matice eliminační metodou násobíme je mezi sebou... Matice je tabulka čísel s konečným počtem
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
IT4Innovations Centre of Excellence
IT4Innovations Centre of Excellence Supercomputing for Applied Sciences Ivo Vondrak ivo.vondrak@vsb.cz: VSB Technical University of Ostrava http://www.it4innovations.eu Motto The best way to predict your
IB112 Základy matematiky
IB112 Základy matematiky Řešení soustavy lineárních rovnic, matice, vektory Jan Strejček IB112 Základy matematiky: Řešení soustavy lineárních rovnic, matice, vektory 2/53 Obsah Soustava lineárních rovnic
Václav Nádraský 3/2010
Václav Nádraský 3/2010 1. Úvod 2. Model sociální sítě 3. Ohodnocovací model v sociálních sítí 4. Zpracování dotazu 5. Dosažené výsledky u implementací v reálných sítích 6. Závěrečné zhodnocení Sociální
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
Složitosti základních operací B + stromu
Složitosti základních operací B + stromu Radim Bača VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky ŠKOMAM 2010-1- 28/1/2010 Složitosti základních operací B +
Asociační i jiná. Pravidla. (Ch )
Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava Osobní údaje Uchazeč: Radim Bača Datum a místo narození: 9.9.1980 Adresa trvalého bydliště: Karla
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
VLIV POČTU NESHODNÝCH VZORKŮ PŘI VYHODNOCOVÁNÍ PŘIJATELNOSTI SYSTÉMU MĚŘENÍ METODOU KŘÍŽOVÝCH TABULEK
VLIV POČTU NESHODNÝCH VZORKŮ PŘI VYHODNOCOVÁNÍ PŘIJATELNOSTI SYSTÉMU MĚŘENÍ METODOU KŘÍŽOVÝCH TABULEK Ing. Jana Hadvičáková Ing. Pavel Klaput, Ph.D. Katedra managementu kvality, VŠB-TU Ostrava E-mail:
Binární vyhledávací stromy pokročilé partie
Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti MI-SOC: 8 SÍTĚ NAČIPU (NOC) doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii ČVUT v Praze Hana
Lineární algebra Operace s vektory a maticemi
Lineární algebra Operace s vektory a maticemi Robert Mařík 26. září 2008 Obsah Operace s řádkovými vektory..................... 3 Operace se sloupcovými vektory................... 12 Matice..................................
Microsoft Office. Excel vyhledávací funkce
Microsoft Office Excel vyhledávací funkce Karel Dvořák 2011 Vyhledávání v tabulkách Vzhledem ke skutečnosti, že Excel je na mnoha pracovištích používán i jako nástroj pro správu jednoduchých databází,
MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]
MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě
Datové struktury pro prostorové vyhledávání
Datové struktury pro prostorové vyhledávání 1998-2011 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ SpatialData 2011 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1
Algoritmizace prostorových úloh
INOVACE BAKALÁŘSKÝCH A MAGISTERSKÝCH STUDIJNÍCH OBORŮ NA HORNICKO-GEOLOGICKÉ FAKULTĚ VYSOKÉ ŠKOLY BÁŇSKÉ - TECHNICKÉ UNIVERZITY OSTRAVA Algoritmizace prostorových úloh Grafové úlohy Daniela Szturcová Tento
Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )
Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent ) Zadání : Titanová běloba (TiO ) se vyrábí ve dvou základních krystalových modifikacích - rutilové a anatasové.
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:
Kolik existuje různých stromů na pevně dané n-prvkové množině vrcholů?
Kapitola 9 Matice a počet koster Graf (orientovaný i neorientovaný) lze popsat maticí, a to hned několika různými způsoby. Tématem této kapitoly jsou incidenční matice orientovaných grafů a souvislosti
2 VLIV POSUNŮ UZLŮ V ZÁVISLOSTI NA TVARU ZTUŽENÍ
Sborník vědeckých prací Vysoké školy báňské - Technické univerzity Ostrava číslo 1, rok 2010, ročník X, řada stavební článek č. 6 Marie STARÁ 1 PŘÍHRADOVÉ ZTUŽENÍ PATROVÝCH BUDOV BRACING MULTI-STOREY BUILDING
Testování sekvenčních obvodů Scan návrh
Testování sekvenčních obvodů Scan návrh Testování a spolehlivost ZS 2011/2012, 6. přednáška Ing. Petr Fišer, Ph.D. Katedra číslicového návrhu Fakulta informačních technologií ČVUT v Praze Evropský sociální
Hledání kořenů rovnic jedné reálné proměnné metoda půlení intervalů Michal Čihák 23. října 2012
Hledání kořenů rovnic jedné reálné proměnné metoda půlení intervalů Michal Čihák 23. října 2012 Problém hledání kořenů rovnice f(x) = 0 jeden ze základních problémů numerické matematiky zároveň i jeden
Soustavy se spínanými kapacitory - SC. 1. Základní princip:
Obvody S - popis 1 Soustavy se spínanými kapacitory - S 1. Základní princip: Simulace rezistoru přepínaným kapacitorem viz známý obrázek! (a rovnice) Modifikace základního spínaného obvodu: Obr. 2.1: Zapojení
Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o. plachy@sefira.cz
Vývoj moderních technologií při vyhledávání Patrik Plachý SEFIRA spol. s.r.o. plachy@sefira.cz INFORUM 2007: 13. konference o profesionálních informačních zdrojích Praha, 22. - 24.5. 2007 Abstrakt Vzhledem
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
Compression of a Dictionary
Compression of a Dictionary Jan Lánský, Michal Žemlička zizelevak@matfyz.cz michal.zemlicka@mff.cuni.cz Dept. of Software Engineering Faculty of Mathematics and Physics Charles University Synopsis Introduction
27.11.2012 Bezpečnostní seminář BIG DATA, Policejní akademie ČR v Praze
RNDr. Jakub Lokoč, Ph.D. Siret Research Group (www.siret.cz) Department of SW Engineering Faculty of Mathematics and Physics Charles University in Prague 1 2.1 billion Internet users worldwide http://royal.pingdom.com
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 63 1 2 3 4 5 6 7 8 9 10 11 2 / 63 Aritmetický vektor Definition 1 Aritmetický vektor x je uspořádaná