Fingerprinting případová studie Josef Šlerka, MLMU Praha
|
|
- Vlasta Navrátilová
- před 6 lety
- Počet zobrazení:
Transkript
1 Fingerprinting případová studie Josef Šlerka, MLMU Praha
2 Kdo jsem... stručné představení...
3 Josef Šlerka Head of R&D v Socialbakers V minulosti šéf Ataxo Interactive Stojím za projekty jako je Social Insider a další Vedu Studia nových médií na FF UK
4 Social Insider a Listening a jejich specifické problémy...
5 Social Insider & co. Social Insider je social media monitoring pro český a slovenský trh, který ma světovou mutací Social Listening. Technologicky využíváme Amazon, Elasticsearch, Redis, Ruby a další.
6 Běžné problémy Datové zdroje jsou zcela asynchronní (stream api v frekvenční api). Tlak je proměnlivý podle typu události. Data jsou relativně velká (půl miliardy zmínek konstatně se měnící v čase). Není předem jasné použití. Nejsou tu jasné reporty.
7 Specifické požadavky Asynchronost dat kupříkladu jinak postavený interface. Nelze kupříkladu stránkovat. (ukázka) Drill-down menu je analytikou, nikoli navigací. Není jasné kolik dat se bude exportovat, je proto třeba exportů na pozadí. Specifický problém při aggregacích spojený s konstatním tlakem dat.
8
9
10 Specifické požadavky Asynchronost dat kupříkladu jinak postavený v interface, nelze kupříkladu stránkovat. (ukázka) Drill-down menu je analytikou, nikoli navigací. Není jasné kolik dat se bude exportovat, je proto třeba exportů na pozadí. Specifický problém při aggregacích spojený s konstatním tlakem dat.
11 Nejvíc sdílený obsah Etuda na téma podobné příspěvky aneb fingerprinting
12 Požadavek najdi mi nebo posty, které jsou si hodně podobné: třeba tak na 90% nebo tak nějak příklad: #Rusko poprvé soudí žoldáka za válčení v řadách separatistů na Ukrajině. Média ho označují za nacionalistu a fašistu. #Rusko poprvé soudí žoldáka za válčení v řadách separatistů na Ukrajině. Média ho označují za nacionalistu a fašistu. http:
13 Klasika Levenstheinova distance, NCD a další nearest neighbor methods
14 Levensthein & Co. Hammingova distance - počet substitucí znaků, které je nutno změnít aby se jeden řetezec proměnil v druhý (předpokládá se stejná vzdálenost) Levenstheinova distance - počet substitucí, vložení a smazání které je třeba pro změnu jednoho řetězce v druhý (řetězce mohou být různě dlouhé)
15 NCD Normalized compression distance. Abstraktní měření vzdálenosti řetězců pomocí kompresí. Autory jsou Rudi Cilibrasi a Paul M. B. Vitanyi Podobné věci sdílí stejné vlastnosti Dvě reprezentace jsou si tím podobnější, čím méně složitých změn je třeba k převodu jedné v druhou
16 NCD
17
18
19 Pro a proti rostoucí komplexita: n(n-1)/2 (u tranzitivních!) 3000 řádku vyžaduje 4.5 million kalkulací proměnlivá velikost textů jde optimalizovat, ale POZOR máme tu konstatní tlak dat a případný clustering musíme dělat on-the-fly umožňuje jemnější klastrování, někdy ale není jasné proč
20 Znovu a lépe key collision methods aneb fingerprinting (a taky perceptual hashing)
21 Základní idea vytvořit takovou reprezentaci obsahu, která bude různé podoby obsahu normalizovat do jednoho klíče de facto je to převrácená podoba hashování místo co nejkratší reprezenace unikátního obsahu tu chcem mít reprezentaci, která postihne co největší variablitu obsahu podobné příspěvky pak získáváme třeba agregací
22 Příklady Fingerprint N-Gram Fingerprint findimagedupes.pl
23 Fingerprint převést na běžnou ASCII reprezentac (zbabit je diakritiky) odmazat všechny přebytečné prázdné mezery všechny znaky změnit na malé odmazat všechny interpunkční znaménka rozdělit řetězec do samostatnách tokenů přes prázdné mezery seřadit tokeny podle abecedy a odmazat duplikující se spojit je všechny opět do jednoho řetězce
24 Detaily řeší specifický problém s diakritikou a šumem znaků pořadí slov v textu je pro něj nerelevatní možnosti vylepšení: odstranění speficických slov (jak stopwords, tak RT či via), lemmatizace či stemming možnostu ušteření místa pomocí klasíckého hash
25 N-Gram Fingerprint převeď na ASCII reprezentaci změň všechny znaky na malé odmaž všechnu interpunkci a všechny speciální znaky získej seznam n-gramů spoj je dohromady
26 Detaily příklad: bratislava ma 1-gram abilrstv oproti předchozímu ve variantě s 1-gramy a 2-gramy dokáže řešit specifické varianty: "Krzysztof", "Kryzysztof" a "Krzystof" mají stejný 1-gram fingerprint
27 findimagedupes.pl standartizuje velikost na 160x160 převeď na škálu šedé rozmazej trochu normalizuje barevnou intenzitu zvyš na maximum kontrast znovu přesampluj na 16x16 a převeď na mono vezmi 32 bytes obrazku a máš fingerprint
28 Pro a proti výkon, výkon, výkon! podobný obsah se dostává pouhou agregací a šetrně ale je to poměrně hrubá podobnost lze však různě vylepšovat
29 Co to spojit? Similarity hashing
30 Simhasing Simhashing (hopefully) made simple
31 Simhasing Všechna písmena můžeme reprezetnovat pomoci ASCII kódu a dál binárně.
32 Simhasing A tím pádem i celá slova...
33 Simhasing Redundance může odstranit...
34 Simhasing A vidím, že 1 a 3 si budou asi tak nějak podobnější a 2 a 4 taky.
35 Simhasing A vidím, že 1 a 3 si budou asi tak nějak podobnější a 2 a 4 taky. Jsou to mimochodem "banana", "bozo", "cabana", and "ozone".
36 Simhasing Můžeme udělat histogramy výskytů jednoho z býtů, ale tím ztratíme celou informaci (nevím o nic o absetujících bitech)
37 Simhasing Možná lepíš je komprimovat je jinak. Třeba za prázdný bit dát mínus jedna a za obsazený dát plus jedna.
38 Simhasing Možná lepšá je komprimovat je jinak. Třeba za prázdný bit dát mínus jedna a za obsazený dát plus jedna.
39 Simhasing A vytvořit tak pěkný histogram...
40 Simhasing A vytvořit tak pěkný histogram.. a ten pak komprimovat...
41 Simhasing Když potom přídáme kupříkladu nové slovo, můžeme spočítat Hammingovu vzdálenost (slovo ssssss je podobnější "banana" než "bozo")
42 Simhasing V téhle jednoduché implementaci hrála silnou roli frekvence písmen (lépe features)...
43 Simhasing Spousta problémů: a) co s texty jako aaaaaahhhhh! a hahahaha! b) co s jinými než ASCII znaky a další...
44 Simhasing co s texty jako aaaaaahhhhh! a hahahaha? tak třeba využití unikátních bigramů (aa, ah, ha, hh) místo písmen?
45 Simhasing co s jinými než ASCII znaky? v zásadě jde jen o to jak se dobrat k unikátnímu identifikátoru nějake featury, čili co třeba použít MD5
46 Simhasing a další?
47 Simhasing 1. "the cat in the tree is white" 2. "the man in the suit is happy" 3. "a white cat is in a tree" Subjektivně jsou si 1 a 3 podobnější, ale...
48 Simhasing... když je přepočítáme...
49 Simhasing Ukáže se, že je to jinak. Díky common words...
50 Simhasing... nám vyjde matematicky něco jiného "the cat in the tree is white",2. "the man in the suit is happy", 3. "a white cat is in a tree"
51 Simhasing řešení?
52 Simhasing Váhy jednotlivých features. Obecná slova obvykle plus a mínus jedna. Neobvyklá plus a mínus tři...
53 Simhasing A už se to zpravilo...
54 Simhasing Tolik krásné uvedné do problémů pro nás manažerské lamy z blogu:
55 Simhashing nejznámější aplikací je asi SimHash používaný Googlem a vyvinutý Mosesem Charikarem původní spr04/cos598b/bib/charikarestim.pdf mnoho paperů a článků:
56 Příklad implementace klasicky nám dává hash různé hashe pro různé stringy
57 Příklad implementace simhash dává podobné hashe pro podobné řetězce
58 Příklad implementace hammingova vzdálenost podobného párů (p1,p2)=4 zatím co (p1,p3)=16 a (p2,p3)=12
59 XOR přítel XOR = máme tak 3 změny z 32, neboli odhadovaný rozdíl 3/32 tedy nebo chcete-li 1-3 / 32 = 0,90625 (90%) (viz třeba blogpost:
60 Integrace zpět k technoligii
61 More like this... Lucene based databáze podporují možnosti najdi mi podobné příspěvky jako je tento, které jsou v Levenstheinu vzdáleny o... Jde tak lehce (byť né úplně) nahradit hammingovu vzdálenost.
62 Děkuji za
Social media jako nové pole pro data mining. 30. 5. 2013 Josef Šlerka
Social media jako nové pole pro data mining 30. 5. 2013 Josef Šlerka Social data profiling řekni mi co lajkuješ a já to povím, kdo jsi Prezidentská volba analýza fanoušků prezidentských kandidátů na
Monitoring soc. sítí. Adam Zbiejczuk - StuNoMe UISK FF UK. Monday, October 10, 11
Monitoring soc. sítí Adam Zbiejczuk - StuNoMe UISK FF UK Mluví se o vás všude... Consumer Generated Media K čemu slouží monitoring soc. sítí? Social Media Online Reputation - SMM je vlastně výstřižkovou
Programování v Pythonu
ƒeské vysoké u ení technické v Praze FIT Programování v Pythonu Ji í Znamená ek P íprava studijního programu Informatika je podporována projektem nancovaným z Evropského sociálního fondu a rozpo tu hlavního
Nástroj pro monitorování a analýzu českého internetu a sociálních médií
Nástroj pro monitorování a analýzu českého internetu a sociálních médií SOCIAL INSIDER VLASTNOSTI Zachycuje data z Facebooku, Twitteru, Youtube, Google+, stejně jako z tisíců českých a slovenských blogů
Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT
Dnešní téma Oblasti standardizace v ICT Případové studie standardizace v ICT: 1) Znakové sady 2) Jazyk 1. technická infrastruktura transfer a komunikace informací, přístup k informacím, sdílení zdrojů
Zadání druhého zápočtového projektu Základy algoritmizace, 2005
Zadání druhého zápočtového projektu Základy algoritmizace, 2005 Jiří Dvorský 2 května 2006 Obecné pokyny Celkem je k dispozici 8 zadání příkladů Každý student obdrží jedno zadání Vzhledem k tomu, že odpadly
Vyhledávání na portálu Knihovny.cz
Inforum 2017 Vyhledávání na portálu Knihovny.cz Petr Žabička, Václav Rosecký, Petra Žabičková Moravská zemská knihovna v Brně Obsah Co indexuje portál Knihovny.cz Rozšíření o centrální index Hledání v
Zadání soutěžních úloh
19. až 21. dubna 2018 Krajské kolo 2017/2018 Úlohy můžete řešit v libovolném pořadí a samozřejmě je nemusíte vyřešit všechny. Za každou úlohu můžete dostat maximálně 10 bodů, z nichž je většinou 9 bodů
klasická kryptologie základní pojmy požadavky na kryptosystém typologie šifer transpoziční šifry substituční šifry
klasická kryptologie transpoziční šifry substituční šifry základní pojmy požadavky na kryptosystém pravidla bezpečnosti silný kryptosystém typologie šifer bloková x proudová s tajným klíčem x s veřejným
Tabulkový procesor. Základní rysy
Tabulkový procesor Tabulkový procesor je počítačový program zpracovávající data uložená v buňkách tabulky. Program umožňuje použití vzorců pro práci s daty a zobrazuje výsledné hodnoty podle vstupních
HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT
HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT Funkce Najít a nahradit slouží k rychlému vyhledávání určitých slov a jejich nahrazování jinými slovy. Lze hledat i určité varianty slov a nahrazovat je buď hromadně (všechny
Vzdálenost jednoznačnosti a absolutně
Vzdálenost jednoznačnosti a absolutně bezpečné šifry Andrew Kozlík KA MFF UK Značení Pracujeme s šifrou (P, C, K, E, D), kde P je množina otevřených textů, C je množina šifrových textů, K je množina klíčů,
1.1 Struktura programu v Pascalu Vstup a výstup Operátory a některé matematické funkce 5
Obsah Obsah 1 Programovací jazyk Pascal 1 1.1 Struktura programu v Pascalu.................... 1 2 Proměnné 2 2.1 Vstup a výstup............................ 3 3 Operátory a některé matematické funkce 5
RESTful API TAMZ 1. Cvičení 11
RESTful API TAMZ 1 Cvičení 11 REST Architektura rozhraní navržená pro distribuované prostředí Pojem REST byl představen v roce 2000 v disertační práci Roye Fieldinga, zkratka z Representional State Transfer
Zbantuj partyju. Koncept virální kampaně
Zbantuj partyju Koncept virální kampaně Odhadovaný přínos: 2 Cíl: Vytvořit pozitivní obraz Ostravy a na venek prezentovat zážitky při návštěvě města. 3 Problém: Návštěvníci neví, proč jet právě do Ostravy.
Úvod do programování 6. hodina
Úvod do programování 6. hodina RNDr. Jan Lánský, Ph.D. Katedra informatiky a matematiky Fakulta ekonomických studií Vysoká škola finanční a správní 2015 Umíme z minulé hodiny Algoritmy Třídění pole: Selection
Snadná úprava stránek, nemusím umět HTML, tvořím obsah téměř jako ve Wordu. Jak změnit obsah nástěnky: vpravo nahoře Nastavení zobrazených informací
Školení Wordpress Nainstalované pluginy: WPML Multilingual CMS Adminize Capability Manager Contact Form 7 Wordpress Download Monitor Google Analytics for WordPress Simple Google Sitemap XML Seznámení s
Fz =a z + a z +...+a z +a z =
Polyadické číselné soustavy - převody M-místná skupina prvků se z-stavovou abecedou umožňuje zobrazit z m čísel. Zjistíme, že stačí vhodně zvolit číslo m, abychom mohli zobrazit libovolné číslo menší než
PHP - úvod. Kapitola seznamuje se základy jazyka PHP a jeho začleněním do HTML stránky.
PHP - úvod Kapitola seznamuje se základy jazyka PHP a jeho začleněním do HTML stránky. Klíčové pojmy: PHP, webový prohlížeč, HTTP, FTP Základní pojmy služba WWW = 1990 první prototyp serveru, od roku 1994
Komprese dat (Komprimace dat)
Komprese dat (Komprimace dat) Př.: zakódovat slovo ARARAUNA K K 2 četnost absolutní relativní A 4,5 N,25 R 2,25 U,25 kód K : kód K 2 :... 6 bitů... 4 bitů prefixový kód: žádné kódové slovo není prefixem
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Programování. Bc. Veronika Tomsová
Programování Bc. Veronika Tomsová Regulární výrazy Regulární výrazy slouží k porovnání a zpracovaní textu PHP podporuje syntaxi POSIX-Extended Regulární výrazy jsou velice vhodné například k ověření emailové
1.5.1 Číselné soustavy
.. Číselné soustavy Předpoklady: základní početní operace Pedagogická poznámka: Tato hodina není součástí klasické gymnaziální sady. Upřímně řečeno nevím proč. Jednak se všichni studenti určitě setkávají
obsah REDESIGN BAREVNOST PÍSMO DOPLŇUJÍCÍ GRAFIKA vznik loga / 4 webové stránky / 19 další užití loga / 20
logo manuál manuál logo Manuál technotrasy definuje logo a soubor pravidel a doporučení, jak s logem zacházet při tvorbě veškerých grafických materiálů, tiskových i interaktivních. Manuál stanovuje principy
FAQ - ČASTO KLADENÉ DOTAZY K SYSTÉMU POWER+
FAQ - ČASTO KLADENÉ DOTAZY K SYSTÉMU POWER+ O..K.SERVIS Plus s.r.o. OKS-T-MGU060005.a 1/12 Obsah 1 BATERIE...4 1.1 Jaké je DC napětí systému? Jaký je potřebný počet baterií?...4 1.2 Proč se má zadávat
Textové popisky. Typ dat
Textové popisky Newsletter Statistica ACADEMY Téma: Možnosti softwaru, datová reprezentace Typ článku: Tipy a triky Máte ve svých datech kategorie ve formě textu? Víme, že někdy není úplně jasné, jak Statistica
Autor: Jan Hošek
Úvod STC Závěr Autor: Jan Hošek Školitel: RNDr. Radim Řehůřek Fakulta jaderná a fyzikálně inženýrzká České vysoké učení technické v Praze 25. 5. 2009 Osnova Úvod STC Závěr 1 Úvod Motivace Ukázka technologie
Informatika Datové formáty
Informatika Datové formáty Radim Farana Podklady předmětu Informatika pro akademický rok 2007/2008 Obsah Datové formáty (datové typy). Textové formáty, vlastnosti zdroje zpráv. Číselné formáty, číselné
þÿ O k t á v o d i g i t á l n í k n i h o v n a F F
DSpace VSB-TUO http://www.dspace.vsb.cz þÿ PY í s p v k y z e s e t k á n í e s k ý c h u~ i v a t e lo s y s þÿ t épy m u í sd p S vp ka y c e 5./ sc eo tnk fá en rí e nec se k ýp ca h p eu~ r s i vf
StatSoft Jak vyzrát na datum
StatSoft Jak vyzrát na datum Tento článek se věnuje podrobně možnostem práce s proměnnými, které jsou ve formě datumu. A že jich není málo. Pokud potřebujete pracovat s datumem, pak se Vám bude tento článek
EXCELentní tipy a triky pro mírně pokročilé. Martina Litschmannová
EXCELentní tipy a triky pro mírně pokročilé Martina Litschmannová Obsah semináře definování názvu dynamicky měněné oblasti, kontingenční tabulky úvod, kontingenční tabulky násobné oblasti sloučení, převod
Karel Kohout 18. května 2010
Karel (karel.kohout@centrum.cz) 18. května 2010 1 2 3 4 Hašovací funkce = Message-Digest algorithm 5, vychází z MD4 (podobně jako SHA-1), autor prof. Ronald Rivest (RSA) Řetězec livobovolné délky na řetězec
Thursday, September 8, 2011. Informační systém ORG Eva Vrbová ředitelka Odboru základních identifikátorů
Informační systém ORG Eva Vrbová ředitelka Odboru základních identifikátorů Identifikátory fyzických osob Rodné číslo Občané ČR Cizinci s trvalým pobytem v ČR Číslo zdravotního pojištěnce Strukturou kopíruje
Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze
Některé potíže s klasifikačními modely v praxi Nikola Kaspříková KMAT FIS VŠE v Praze Literatura J. M. Chambers: Greater or Lesser Statistics: A Choice for Future Research. Statistics and Computation 3,
Možnosti aplikací Google pro analýzu (geo(
Možnosti aplikací Google pro analýzu (geo( geo)dat Lukáš MAREK & Vít PÁSZTO -Katedra geoinformatiky PřF UP Olomouc GOOGLE MAPS & EARTH Největší hráč na trhu určující celosvětové trendy v oblasti IT a intenetu
Technická kybernetika. Obsah. Principy zobrazení, sběru a uchování dat. Měřicí řetězec. Principy zobrazení, sběru a uchování dat
Akademický rok 2016/2017 Připravil: Radim Farana Technická kybernetika Principy zobrazení, sběru a uchování dat 2 Obsah Principy zobrazení, sběru a uchování dat strana 3 Snímač Měřicí řetězec Měřicí obvod
Instalace a konfigurace web serveru. WA1 Martin Klíma
Instalace a konfigurace web serveru WA1 Martin Klíma Instalace a konfigurace Apache 1. Instalace stáhnout z http://httpd.apache.org/ nebo nějaký balíček předkonfigurovaného apache, např. WinLamp http://sourceforge.net/projects/winlamp/
AVL stromy. pro každý uzel u stromu platí, že rozdíl mezi výškou jeho levého a pravého podstromu je nejvýše 1 stromy jsou samovyvažující
Stromy 2 AVL AVL stromy jména tvůrců stromů: dva Rusové Adelson-Velskii, Landis vyvážené binární stromy pro každý uzel u stromu platí, že rozdíl mezi výškou jeho levého a pravého podstromu je nejvýše 1
Big Data. Josef Šlerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, Praha
Big Data Josef Šlerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, Praha 3 000 000 000 počet hledání na Googlu denně 30 000 000 000 počet zpráv a příspěvků na Facebooku měsíčně 5 000
Číslicové filtry. Honza Černocký, ÚPGM
Číslicové filtry Honza Černocký, ÚPGM Aliasy Digitální filtry Diskrétní systémy Systémy s diskrétním časem atd. 2 Na co? Úprava signálů Zdůraznění Potlačení Detekce 3 Zdůraznění basy 4 Zdůraznění výšky
Semestrální úloha 1 z předmětu Programovací jazyk C. Textový merge. Student:
Semestrální úloha 1 z předmětu Programovací jazyk C Textový merge Napište program, který spojí dva textové soubory. První soubor je datový, obsahuje databázi, tj. první řádek představuje seznam sloupců
Jak v Javě primitivní datové typy a jejich reprezentace. BD6B36PJV 002 Fakulta elektrotechnická České vysoké učení technické
Jak v Javě primitivní datové typy a jejich reprezentace BD6B36PJV 002 Fakulta elektrotechnická České vysoké učení technické Obsah Celočíselný datový typ Reálný datový typ Logický datový typ, typ Boolean
HLEDEJCENY.mobi. Obsah. Mobilní verze e-shopu. Důvody instalace
Obsah HLEDEJCENY.mobi Mezi Vodami 1952/9 e-mail: info@hledejceny.cz HLEDEJCENY.mobi... 1 Mobilní verze e-shopu... 1 Důvody instalace... 1 Výhody... 2 Co je k mobilní verzi potřeba... 2 Objednávka služby...
OpenSSL a certifikáty
OpenSSL a certifikáty Petr Krčmář 1. června 2013 Uvedené dílo podléhá licenci Creative Commons Uved te autora 3.0 Česko. Petr Krčmář (Root.cz) OpenSSL a certifikáty 1. června 2013 1 / 20 OpenSSL: o čem
Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
Logika pro každodenní přežití Stefan Ratschan Katedra číslicového návrhu Fakulta informačních technologíı České vysoké učení technické v Praze Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
LEKCE 6. Operátory. V této lekci najdete:
LEKCE 6 Operátory V této lekci najdete: Aritmetické operátory...94 Porovnávací operátory...96 Operátor řetězení...97 Bitové logické operátory...97 Další operátory...101 92 ČÁST I: Programování v jazyce
FORMÁT SOUBORŮ S PLATEBNÍMI PŘÍKAZY PRO CITIBANK EUROPE PLC, ORGANIZAČNÍ SLOŽKA Systém internetového bankovnictví CitiBusiness Direct
FORMÁT SOUBORŮ S PLATEBNÍMI PŘÍKAZY PRO CITIBANK EUROPE PLC, ORGANIZAČNÍ SLOŽKA Systém internetového bankovnictví CitiBusiness Direct FORMÁT SOUBORŮ S PLATEBNÍMI PŘÍKAZY pro Citibank Europe plc, organizační
- znakové konstanty v apostrofech, např. a, +, (znak mezera) - proměnná zabírá 1 byte, obsahuje kód příslušného znaku
Znaky - standardní typ char var Z, W: char; - znakové konstanty v apostrofech, např. a, +, (znak mezera) - proměnná zabírá 1 byte, obsahuje kód příslušného znaku - v TP (často i jinde) se používá kódová
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
Kódováni dat. Kódy používané pro strojové operace
Kódováni dat Před zpracováním dat například v počítači je třeba znaky převést do tvaru, kterému počítač rozumí, tj. přiřadit jim určité kombinace bitů. Tomuto převodu se říká kódování. Kód je předpis pro
Business Intelligence
Business Intelligence Josef Mlnařík ISSS Hradec Králové 7.4.2008 Obsah Co je Oracle Business Intelligence? Definice, Od dat k informacím, Nástroj pro operativní řízení, Integrace informací, Jednotná platforma
Data v počítači. Informační data. Logické hodnoty. Znakové hodnoty
Data v počítači Informační data (elementární datové typy) Logické hodnoty Znaky Čísla v pevné řádové čárce (celá čísla) v pohyblivé (plovoucí) řád. čárce (reálná čísla) Povelová data (instrukce programu)
Kryptografie, elektronický podpis. Ing. Miloslav Hub, Ph.D. 27. listopadu 2007
Kryptografie, elektronický podpis Ing. Miloslav Hub, Ph.D. 27. listopadu 2007 Kryptologie Kryptologie věda o šifrování, dělí se: Kryptografie nauka o metodách utajování smyslu zpráv převodem do podoby,
Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 3. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.
Zdokonalování gramotnosti v oblasti ICT Kurz MS Excel kurz 3 1 Obsah Řazení dat... 3 Seřazení textu a čísel... 3 Další možné seřazení je možné podle barev, písma a ikon... 4 Filtry, rozšířené filtry...
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
KIV/ZIS - cvičení. je dobré chodit na cvičení, lépe se pak vypracovávají semestrálky. první 2 týdny podle kapacity 1/37
KIV/ZIS - cvičení David Široký (dsiroky@kiv.zcu.cz) http://portal.zcu.cz -> Courseware -> Moje předměty -> KIV/ZIS http://dasir.cz/vyuka/ docházka - není povinná, ale je sledovaná přesuny mezi cvičeními
Algoritmy a datové struktury
Algoritmy a datové struktury Data a datové typy 1 / 28 Obsah přednášky Základní datové typy Celá čísla Reálná čísla Znaky 2 / 28 Organizace dat Výběr vhodné datvé struktry různá paměťová náročnost různá
Informatika pro moderní fyziky (2) základy Ruby, zpracování textu
Informatika pro moderní fyziky (2) základy Ruby, zpracování textu František HAVLŮJ e-mail: haf@ujv.cz ÚJV Řež oddělení Reaktorové fyziky a podpory palivového cyklu akademický rok 2015/2016 6. října 2015
Zobrazování barev. 1995-2015 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/
Zobrazování barev 1995-2015 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ ColorRep 2015 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1 / 18 Barevné schopnosti HW True-color
DIGITÁLNÍ MULTIMETR DUCA- LCD96
ELEKTROKOMPONENTY AZ spol. s r.o. Za Nádražím 2547 Tel.: +420 381 001 691 (Mob.: +420 774 425 961) provozovna Pražská 313 E-mail: Info@elektrokomponenty.cz 397 01 Písek Web: www.elektrokomponenty.cz DIGITÁLNÍ
Základní komunikační řetězec
STŘEDNÍ PRŮMYSLOVÁ ŠKOLA NA PROSEKU EVROPSKÝ SOCIÁLNÍ FOND Základní komunikační řetězec PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL
EMBARCADERO TECHNOLOGIES. Jak na BYOD chytře? Možnosti zapojování různých mobilních zařízení do podnikových informačních systémů.
Jak na BYOD chytře? Možnosti zapojování různých mobilních zařízení do podnikových informačních systémů. Trendy a móda EMBARCADERO TECHNOLOGIES Popularita a prodej mobilních zařízení roste Skoro každý má
Co je to výsledek? Capability Approach a ESI fondy
Co je to výsledek? Capability Approach a ESI fondy Petr Bouchal Evaluace ve světle nových příležitostí, 9. 6. 2015 1 Co je to výsledek? Wellbeing Utilitariáni a ti druzí Capability approach Cože? Příklad
PA159 - Bezpečnostní aspekty
PA159 - Bezpečnostní aspekty 19. 10. 2007 Formulace oblasti Kryptografie (v moderním slova smyslu) se snaží minimalizovat škodu, kterou může způsobit nečestný účastník Oblast bezpečnosti počítačových sítí
WWW STRÁNKY Tvorba webové stránky TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY.
WWW STRÁNKY Tvorba webové stránky TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY. Úvod do tvorby webové stránky Jména souborů Svoje HTML soubory pojmenujte
Red Black strom (Red Black Tree) Úvod do programování. Rotace. Red Black strom. Rotace. Rotace
Úvod do programování Michal Krátký 1,Jiří Dvorský 1 1 Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programování, 2004/2005 Red Black strom je binární strom s jedním dvouhodnotovým příznakem
Digitalizace dat metodika
Digitalizace dat metodika Digitalizace Jak počítač získá jedničky a nuly, se kterými potom počítá a které je schopen si pamatovat? Pomocí různých přístrojů a zařízení (mikrofon, fotoaparát, skener, kamera,
AUTOMATY A GRAMATIKY. Pavel Surynek. Kontextové uzávěrové vlastnosti Turingův stroj Rekurzivně spočetné jazyky Kódování, enumerace
AUTOMATY A 11 GRAMATIKY Pavel Surynek Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra teoretické informatiky a matematické logiky Kontextové uzávěrové vlastnosti Turingův stroj Rekurzivně
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina - 22. 3. 2018, zapsala Revize zápisu Martin Holub, 27. 3. 2018 I. Frekvenční tabulky opakování z minulé hodiny Frekvenční tabulka je nejzákladnější nástroj
Novinky ve vývoji individuálních progresivních čoček. Petr Ondřík Rodenstock ČR, s.r.o.
Novinky ve vývoji individuálních progresivních čoček. Petr Ondřík Rodenstock ČR, s.r.o. 06 March 2013, Page 1 Trend ve vývoji individuálních progresivních čoček. Astigmatismus do blízka. Výsledky univerzitní
Architektury počítačů
Architektury počítačů IEEE754 České vysoké učení technické, Fakulta elektrotechnická A0M36APO Architektury počítačů Ver.1.20 2014 1 Fractional Binary Numbers (zlomková binární čísla / čísla v pevné řádové
Vyhledávání v textu. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava
Vyhledávání v textu doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 9. března 209 Jiří Dvorský (VŠB TUO) Vyhledávání v textu 402
SNMP Simple Network Management Protocol
SNMP Simple Network Management Protocol Vypracoval: Lukáš Skřivánek Email: skrivl1@fel.cvut.cz SNMP - úvod Simple Network Management Protocol aplikační protokol pracující nad UDP (porty 161,162) založený
Substituční šifry a frekvenční analýza. Mgr. Radim Janča ijanca@fit.vutbr.cz
Substituční šifry a frekvenční analýza Mgr. Radim Janča ijanca@fit.vutbr.cz Harmonogram Celkově 4 cvičení v P256 Prezentace z cvičení budou zveřejňovány na http://buslab.fit.vutbr.cz/kib/ 3 samostatné
Zpracování obrazů. Honza Černocký, ÚPGM
Zpracování obrazů Honza Černocký, ÚPGM 1D signál 2 Obrázky 2D šedotónový obrázek (grayscale) Několikrát 2D barevné foto 3D lékařské zobrazování, vektorová grafika, point-clouds (hloubková mapa, Kinect)
Jak Facebook pomáhá automobilce FORD k úspěchu. Vladimír Rejlek Interactive Director WUNDERMAN
Jak Facebook pomáhá automobilce FORD k úspěchu Vladimír Rejlek Interactive Director WUNDERMAN Doba PŘED strategií pro sociální sítě FORD je pro Čechy lovebrand. Bez podpory si jej našlo 47.000 fanoušků.
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM CÍLE KAPITOLY Využívat pokročilé možnosti formátování, jako je podmíněné formátování, používat vlastní formát čísel a umět pracovat s listy. Používat
Digitální signály a kódy
EVROPSKÝ SOCIÁLNÍ FOND Digitální signály a kódy PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 Digitální signál
Soustavy lineárních rovnic
Soustavy lineárních rovnic V této kapitole se budeme zabývat soustavami lineárních diferenciálních rovnic y = a (x)y + a (x)y + + a n (x)y n + f (x) y = a (x)y + a (x)y + + a n (x)y n + f (x). y n = a
Grafická prezentace projektu GNUškola
Grafická prezentace projektu GNUškola Martin Beránek PEDF UK 7. dubna 2014 Martin Beránek (PEDF UK) Grafická prezentace projektu GNUškola 7. dubna 2014 1 / 27 Gnuškola Tato prezentace je vytvořena pomocí
Matematické základy šifrování a kódování
Matematické základy šifrování a kódování Permutace Pojem permutace patří mezi základní pojmy a nachází uplatnění v mnoha oblastech, např. kombinatorice, algebře apod. Definice Nechť je n-prvková množina.
GDPR A INFORMAČNÍ SYSTÉM. Nadežda Andrejčíková Libor Piškula
GDPR A INFORMAČNÍ SYSTÉM Nadežda Andrejčíková Libor Piškula GDPR a informační systém Obsah: 1. Principy ochrany 2. Legitimnost zpracování osobních údajů 3. Praktické dopady GDPR 4. Technologické aspekty
Úvod do programování. Lekce 1
Úvod do programování Lekce 1 Základní pojmy vytvoření spustitelného kódu editor - psaní zdrojových souborů preprocesor - zpracování zdrojových souborů (vypuštění komentářů atd.) kompilátor (compiler) -
Výukový materiál KA č.4 Spolupráce se ZŠ
Výukový materiál KA č.4 Spolupráce se ZŠ Modul: Téma workshopu: Výpočetní technika Co je to internet? Jak si udělat vlastní www stránku? Vypracovala: Ing. Lenka Hellová Termín workshopu: 30. říjen 2012
STRUčNÝ NÁVOD PRO KONFIGURACI FREKVENčNÍCH MĚNIčŮ
CS STRUčNÝ NÁVOD PRO KONFIGURACI FREKVENčNÍCH MĚNIčŮ LOVATO ELECTRIC S.P.A. 24020 GORLE (BERGAMO) ITALIA VIA DON E. MAZZA, 12 TEL. 035 4282111 FAX (Nazionale): 035 4282200 FAX (International): +39 035
Šifrování, kódování a jejich aplikace - ak. rok 2016/17
Šifrování, kódování a jejich aplikace - ak. rok 2016/17 (zkratka předmětu: KAP/SKA, počet kreditů: 6) Předmět je zakončen zkouškou, které musí předcházet získání zápočtu. Podmínky pro získání zápočtu a
Jak vypadá opravdová discovery služba
Jak vypadá opravdová discovery služba K čemu Summon? Chybí jasné a přitažlivé místo pro vyhledávání Potíže s určením vhodných zdrojů Současné nástroje neodpovídají očekáváním uživatelů Nejlepší místo,
PSK2-5. Kanálové kódování. Chyby
PSK2-5 Název školy: Autor: Anotace: Vzdělávací oblast: Předmět: Tematická oblast: Výsledky vzdělávání: Klíčová slova: Druh učebního materiálu: Typ vzdělávání: Ověřeno: Zdroj: Vyšší odborná škola a Střední
Kódy a kódování dat. Binární (dvojkové) kódy. Kód Aikenův
Kódy a kódování dat Kódování je proces, při kterém se každému znaku nebo postupnosti znaků daného souboru znaků jednoznačně přiřadí znak nebo postupnost znaků z jiného souboru znaků. Kódování je tedy transformace
ADX. Modul pro komunikaci nadřízeného řídícího systému s tenzometrickými váhami po sériové lince RS-485. w w w. p r o b e t. c z
ADX Modul pro komunikaci nadřízeného řídícího systému s tenzometrickými váhami po sériové lince RS-485 w w w. p r o b e t. c z Adresa: Olomoucká 235/130 796 07 Držovice Telefon: +420 582 339 457 +420 602
Programování v Pythonu
ƒeské vysoké u ení technické v Praze FIT Programování v Pythonu Ji í Znamená ek P íprava studijního programu Informatika je podporována projektem nancovaným z Evropského sociálního fondu a rozpo tu hlavního
Kaskádové styly základy grafiky
1 Kaskádové styly základy grafiky Vymezení pojmů Historie Základy stylů 2 Co je to CSS? Vznik CSS a je možné zařadit přibližně do roku 1997. Pojem CSS by se dal shrnout definicí :"souhrn pravidel a metod
Barvy v digitální fotografii. Jaroslav Svoboda
Barvy v digitální fotografii Jaroslav Svoboda Co je fotografie? Stroj času Trošku víc fyzikálně a bez sci-fi Záznam odrazu světla v určitém časovém intervalu Můžeme zaznamenat nejen intenzitu, ale i vlnovou
1. Obsah. Publikováno: 16.05.2007
API pro službu Mobilem.cz, verze XML 5.01 Tento dokument je určen pro partnery Mobilem.cz. Není dovoleno obsah použít pro jiný účel, než za jakým byl poskytnut. Všechna práva vyhrazena pro Crazy Tomato
MOJESODEXO.CZ POUKÁZKY V OBÁLKÁCH. Uživatelská příručka
MOJESODEXO.CZ POUKÁZKY V OBÁLKÁCH Uživatelská příručka 1. Úvod Tento dokument vám pomůže lépe pochopit, co je to objednávka poukázek v obálkách a jak takovou objednávku vytvořit. 1.1 Co jsou to poukázky
2000 zveřejnění dobové zprávy General Report on Tunny informací nedostatek k odvození konstrukce šifrátoru Lorenz cíl: odvození pravděpodobného
Luštění německého šifrovacího stroje Lorenz podle bakalářské práce Petra Veselého, MFF UK 22. února 2012 2000 zveřejnění dobové zprávy General Report on Tunny informací nedostatek k odvození konstrukce
Ročník II. Anglický jazyk. Období Učivo téma Metody a formy práce- kurzívou. Kompetence Očekávané výstupy. Průřezová témata. Mezipřed.
Úvod Pozdravy Zvířata IX. X. Opakování učebnice Happy House 1 Představení nové učebnice Happy House2 Pozdravy Abeceda A-G Hláskování a hádání slov, názorné obrázky Způsobové slovesa I can, I can t Abeceda
Komprese dat (KOD) Semestrální projekt Implementace RLE, BWT a LZW
Komprese dat (KOD) Semestrální projekt Implementace RLE, BWT a LZW Autor: Bc. Petr Kašpar Login: KAS265 Datum: 8. května 2009 Úvod Úkolem tohoto projektu bylo implementovat nějaký komprimační algoritmus.
Miroslav Holec. Software & Cloud Architect. Microsoft MVP: Microsoft Azure MCSD, MCSA, MTA. Zvyšujeme výkonnost aplikací s. (Azure) Redis Cache
Miroslav Holec Software & Cloud Architect Microsoft MVP: Microsoft Azure MCSD, MCSA, MTA miroslavholec.cz @miroslavholec Zvyšujeme výkonnost aplikací s (Azure) Redis Cache odkaz.me/redis Agenda Úvod do