Data-mining, sociální sítě a zpravodajství



Podobné dokumenty
VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA EKONOMICKÁ FAKULTA. Produkční plán

Ing. Pavel Rosenlacher

Ministudie: Content marketing v B2B v ČR a USA, 2013 Téma na přání účastníků B2B monitoru

Internet. Komunikace a přenosy dat. Mgr. Jan Veverka Střední odborná škola sociální Evangelická akademie

Webová analytika v kostce. Pavel Jašek Marketing Monday 7. listopadu 2011

Pravidelné aktivity na internetu I. ZÁKLAD: Respondenti 10+ využívající internet, n=6536 (fáze 1), n=6594 (fáze 2), n=2153 (fáze 3), n=2237 (fáze 4)

Reaguje vyhledávání na potřeby uživatelů nebo tomu je naopak?

PROJEKT BAKALÁŘSKÉ PRÁCE

Představení společnosti Concordia Consulting CONCORDIA CONSULTING

PRAHA, 21/01/2011 Internet vede jako zdroj informací při nákupu zboží a služeb

Agregátoři - fenomén síťové ekonomiky

Rizika sociálních sítí

Rizika sociálních sítí aneb Jak se chovat na internetu (Jak sociální sítě ubližují (nejen) dětem aneb nebezpečí na internetu)

MEDIÁLNÍ CHOVÁNÍ LIDÉ Z AGENTUR VS. KLIENTI VS. ONLINE POPULACE ČR

Nová média a oslovení mládeže

Video natáčení / střih

INTERNET cesta ke spotřebiteli

Co se na internetu za 10 let změnilo a co se za 10 let (zřejmě) změní?

Marketingový plán základ podnikatelského plánu část 1 MUDr. Jan Šrogl

Různé úhly pohledu. Zdroje

UŽIVATELÉ SOCIÁLNÍCH SÍTÍ V ĆR

Aktuální hrozby internetu. 1.Trojské koně (malware) 2.Phishing 3.Sociální sítě

Setkání interních auditorů z finanční oblasti. Nové výzvy pro interní audit Big Data a socialní sítě

Ing. Pavel Rosenlacher

Máte již dobře vyzbrojeného firemního SYNTETIKA?

Seminář Budoucnost IT trendy versus aktuální potřeby. 6. dubna 2016

Co je to sociální síť?

Marketingové využití internetu

Sborník Evropského měsíce kybernetické bezpečnosti 2014: Obsah Příspěvky Kuchařík Šesták, Krulík Krulík, Krulíková, Požár Babulík, Stodůlka

Vysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky. Metodické listy pro předmět ŘÍZENÍ PODNIKU 2

Dotazník pro 5. ročník Základní školy Havlíčkova, Litoměřice. Dotazník k bakalářské práci na téma:

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

Fake news Média, sociální sítě, zpravodajské informace, fake news. Fórum dárců 04/2019

SíťIT: Portál na podporu sociální sítě informatiků v ČR

Mobilní datové služby jsou na postupném vzestupu

Bezpečné používání internetu v bezpečných učebnách. Jak používat bezpečně internet a jak ochránit má osobní data?

Jak úspěšně bojovat s ekonomickou krizí pomocí CI

Zvláštní průzkum Eurobarometer 386. Evropané a jazyky

Sociální síť. = propojená skupina lidí na internetu

Firmy na sociálních sítích Trendy na sociálních sítích Zlatá pravidla marketingu na sociálních sítích

StoreMore Vysokokapacitní úložiště

Rozvoj finanční kapacity - Fundraising

Obsah. Úvod 7 Zpětná vazba od čtenářů 7 Dotazy 8 Errata 8 Poznámka k aktuálnosti 8 Konvence použité v knize 8

Používání sociálních médií v municipalitách České republiky. Ing. Libuše Svobodová, Ph.D. Ing. Jaroslava Dittrichová, Ph.D.

aneb Snadné psaní bez pravidel Publikace je chráněna autorským právem Pavel Fara 2013

Základní pojmy: média a komunikace, informace, web, sociální síť Co je sociální síť, základní pravidla používání, reklama a marketing FaceBook

Základní údaje. Profesní profil

Znamená internetové video i online televizi?

Profese manažera v organizacích veřejné správy

Proč je kombinace výzkumných metod a různých zdrojů dat v současné době trendy

CO JE MARKETING V SOCIÁLNÍCH MÉDIÍCH?

Jak získat nové čtenáře

Marketingové aktivity B2B firem a struktura marketingových rozpočtů Jaro 2014

Nabídka reklamních formátů v rámci serveru - lokální weby -

v praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání

Integrace Microsoft Dynamics 365 s aplikacemi Leady a MERK

HREA Excellence Award 2013

Název projektu: ICT nás baví Registrační číslo: CZ.1.07/1.3.00/


Veřejná ekonomika a správa

XD16MPS Manažerská psychologie pro kombinované studium. Úvod do manažerské psychologie Předmět, význam, vývoj

Monitoring hlasu zákazníka Význam sociálních médií pro Competitive Intelligence

Zásady ochrany údajů v evropském regionu

Práce s daty pro větší úspěšnost prodeje a kvalitnější péči

BA_EM Electronic Marketing. Pavel

Úvod do on-line marketingu

Pracovní list č. 1 ze série pod názvem Studentská obchodní snídaně NETWORKING

Opatření proti legalizaci výnosu z trestné činnosti a financování terorismu v pojišťovnictví

OBSAH. Obsah ÚVODEM 7 KAPITOLA 1

Osobní údaje: jméno, adresa, telefonní číslo, ová adresa, údaje založené na umístění, ID zařízení. Citlivé (finanční) informace

Produktový list. Firemní profily

Efektivita osvětové. náhradní rodinné. Závěrečná zpráva. Únor 2015

TEMATICKÉ OKRUHY PRO OPAKOVÁNÍ K MATURITNÍ ZKOUŠCE

NCKB / Institut mezinárodních studií, Fakulta sociálních věd, Univerzita Karlova

Informatizace společnosti Petra Štogrová Jedličková

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí:

Stará a nová média, participace a česká společnost

VYHODNOCENÍ PROJEKTU ZAMĚŘENÉHO NA NEBEZPEČNÉ JEVY V SOUVISLOSTI S POUŽÍVÁNÍM INTERNETU

Úvod do sociálních sítí

Elektronická bezpečnost v Kraji Vysočina. Lucie Časarová, Kraj Vysočina

III/2- Inovace a zkvalitnění výuky prostřednictvím ICT

Dotazník: průvodce výběrem vzdělávací strategie pro MSP

Scénáře a důvody pro nasazení Exchange 2010 a Lync Martin Panák

PROFESIONÁLNÍ ODPOSLECH MOBILNÍHO TELEFONU SPYTEL

Informační média a služby

PR Akademie pro veřejnou správu. Roman Kučera

DIGI.JOB.ID Lekce 1 Úvod. Informace pro učitele

Tisková zpráva. Tři roky českého internetu v číslech

MEC Multiscreen Study Výsledky mezinárodního výzkumu

METODOLOGIE. Sběr dat proběhl prostřednictvím internetového dotazníku (CAWI) na internetovém panelu agenturou STEM/MARK

Aktualizace Dlouhodobého záměru

Simultánní přepis online pro osoby se sluchovým postižením

Problematika transferu technologií ve výuce a praxi Zajištění vzdělávání v oblasti transferu technologií v rámci výuky na LF v Plzni

DUM č. 12 v sadě. 36. Inf-12 Počítačové sítě

TÉMATA MATURITNÍCH PRACÍ PRO ŠK. R

Jak optimálně zjišťovat názory zákazníků v digitální době? Hlavně rychle a kvalitně! Říjen 2014

32 APZ Nabídky. Popis modulu

tipů, jak zlepšit PPC kampaně před Vánoci

Transkript:

Data-mining, sociální sítě a zpravodajství Marek Babulík; Martin Stodůlka V samotném úvodu této práce bychom rádi specifikovali naši výzkumnou činnost. Jsme studenti Policejní akademie České republiky v Praze, a mimo jiné nás velice zaujala možnost být součástí mezinárodního studentského spolku AFCEA, jež se zaměřuje především na oblast kybernetické bezpečnosti. Přestože oba studujeme rozdílné studijní programy, dokázali jsme i tak nalézt společnou průsečnici našich oborů, kdy každý z nás přináší odlišný diskurz na zkoumanou problematiku. Z rozdílného akademického zaměření dochází k diverzifikaci názorů, které však vedou ke konkrétnějšímu a potenciálně progresivnějšímu výsledku. V této spolupráci oba spatřujeme obrovský potenciál v rámci společné koordinace činností obou fakult, což by mohlo vést k dalšímu rozvoji vědecké činnosti na naší Alma mater. V současné době se zabýváme výzkumem v oblasti Data-miningu, jakožto metody získávání volně dostupných informací zpravodajskými službami. Současně s tím se snažíme upozornit na množství informací, které za sebou uživatelé zanechávají v podobě své internetové stopy. Moto: Okhrana, carský předchůdce GPU, údajně vynalezl systém evidence, ve kterém byl každý podezřelý zaznamenán na velké kartě, v jejíž středu bylo jeho jméno označeno červeným kruhem; jeho političtí přátelé byli označeni menšími červenými kruhy a jeho nepolitické známosti se označily kruhy zelenými; hnědé kruhy značily osoby, které jsou v kontaktu s přáteli podezřelého, ale ne přímo se samotným podezřelým; křížové vztahy mezi přáteli podezřelého - politickými a nepolitickými, a přáteli jeho přátel, byly zaznačeny linií mezi příslušnými kruhy. Je zřejmé, že omezení této metody jsou stanovena pouze velikostí těchto jednotlivých karet, avšak teoreticky by jeden gigantický list mohl ukázat jednotlivé vztahy v celé populaci. A to je utopický cíl totalitní tajné policie. Volný překlad: Arendt, Hanna, Origins of Totalitarianism. Doba, ve které žijeme, je charakteristická svým značným technologickým pokrokem a urychlováním všech možných činností, jež člověk ve svém osobním i profesním životě vykonává. Jedním ze základních požadavků na moderního člověka je právě rychlost. Doprava, výroba, komunikace toto je pouze pár základních oblastí, které trend urychlování naplno zasáhl. V souvislosti s komunikací rychlost předávání/získávání informací do značné míry ovlivnily sociální sítě, jež jsou obrovským hitem několika posledních let, a jejichž popularita mezi jednotlivými uživateli vyletěla obrovskou rychlostí do internetových výšin. Velmi snadný způsob komunikace z kteréhokoliv místa na planetě Zemi, kde se vyskytuje internetový signál, je velkým lákadlem pro milióny nových uživatelů. Takto obrovské množství lidí

zapojených v projektu sociálních sítí sebou však přináší řadu otázek, z nichž nemalé množství zpochybňuje bezpečnost těchto sítí a nezneužitelnost informací o samotných uživatelích. Každý z nás si musí uvědomit, že ve světě, kde žijeme, jsou informace až na prvním místě. Pod pojmem data-mining, neboli dolování dat, se ukrývá značné množství různorodých definic, a to zejména dle toho, v jakém odvětví se tato metoda použije. Obecná definice tohoto pojmu uvádí, že se jedná o analytickou metodu, která umožňuje nalézt různé druhy informací a specifických dat, jež jsou skryté ve velkých objemech dat soustředěných na jednom místě. Tato definice pokrývá obecné charakteristiky data-miningu. Určuje však tento pojem úplně? Dle našeho společného názoru lze za dolování dat považovat mnohem větší spektrum činností nežli jen řízené vyhledávání pomocí IT technologií. Vezměme si kupříkladu odposlech mobilního zařízení pomocí IMSI catcheru. Zjištěné informace o mobilním telefonu, hovoru, textové zprávě či přesné lokace volajícího jsou přenášeny ve formě dat. Jedná se tedy také o určitou odnož analytické metody data-miningu. Na obdobném principu je postaveno také monitorování osob pomocí průmyslových kamer nebo průzkum potenciálního zákazníka ze strany společností zabývajících se činností v oblasti reklamy a marketingu. Jestliže se pokusíme sami vydefinovat pojem Data-minig, docházíme k následující tezi: Za Data-mining se dá považovat jakákoliv forma analytické práce, která dokáže výstupní data přeměnit na konkrétní informace odpovídající zájmům zadavatele. Open source intelligence: Předvídavost je nástrojem nejjasnějšího vládce, nejmoudřejšího vojevůdce, jímž tito předčí protivníka a vynikají nad ostatní. Předvídavosti se nám ovšem nedostane od bohů a duchů nezískáme ji hloubáním o minulosti, nevyčteme ji z postavení hvězd. Nezískáme ji jinak, než od lidí, kteří vědí, co je v nepříteli. A k tomu je tu pět druhů zvědů. (Sun Tzu Umění války) Jedná se o zpravodajské informace získané z otevřených zdrojů. Ty jsou dostupné široké veřejnosti. Až 95% informací v oblasti zpravodajství pochází z otevřených zdrojů těmi mohou být: média (TV, rádio, noviny apod.), internet (sociální sítě, blogy, folksonomie, videoservery apod.), různé formy rejstříků, reportů, literatury (včetně šedé). Výčet OSINT zdrojů rozhodně není uzavřený. S obrovským arzenálem možností se však pojí jedno hlavní negativum. Tím je potenciální přehlcení informacemi, které může vést například k přehlédnutí signifikantní zpravodajské informace. V našem případě jsme se zaměřili na dolování dat ze sociálních sítí. Ty zažily v poslední dekádě obrovský boom. Z mini sítí fungujících pro uzavřenou skupinu lidí postupně vznikli giganti ovlivňující každodenní život nezanedbatelné části populace. S rychlým nárůstem popularity přicházejí také vedlejší negativní jevy, převážné v oblasti ochrany osobních údajů. Bohužel na tak rapidní rozvoj nestihla společnost zareagovat osvětou, jakým způsobem se na sítích chovat. Shrnuto do jednoduché myšlenky na ulici osobní data nesdělíme, kdežto on-line poskytujeme citlivé a mnohdy mnohem osobnější data i bez žádání. Malé děti pochopily, že od cizince se neberou sladkosti. Teď je na řadě, aby nejen mladí pochopili, že USB flash disk nalezený na ulici do

počítače nepatří. Open source intelligence jsou hodně využívány také v soukromém sektoru. Existuje celá řada programů (např. Maltego), které jsou určeny jak pro vlastní potřebu, tak i pro korporace, většinou pak firmy působící v oblasti konkurenčního zpravodajství (Competitive Intelligence). Sociální sítě: Jako výborný nástroj, sloužící k poskytování informací, se v posledních letech ukázaly být sociální sítě. Vidina tak snadno zjistitelných informací o milionech uživatelů po celém světě byla pouze pár let zpátky považována za nereálnou, v lepším případě za vysoce nepravděpodobnou. Ovšem s tím, jak se vyvíjí technologie, se vyvíjí i společnost a její smýšlení. S možností sdílení informací v globálním měřítku začali mít lidé potřebu jít s dobou a užívat globální sociální sítě (Facebook, Twitter, Myspace, Instagram, Flickr). Obrovský společenský boom, uživatelské možnosti a určitý prvek mainstreamové přitažlivosti za krátký čas oslovili velké množství nových uživatelů. Přidávání videí, fotek, nových přátel, navštívených míst. Vyplňování osobních informací o bydlišti, telefonním čísle, rodinných příslušnících. Psaní statusů o tom, co právě dělám, co si myslím nebo kde se právě nacházím. Zveřejňování oblíbených knih, filmů, muziky. Označování nepřeberně dlouhého seznamu stránek tlačítkem To se mi líbí. Uživatel byl samotnou sociální sítí a jejími nabídkami na zodpovězení různorodých dotazů dotlačen k tomu, aby zveřejnil informace, jež by za normálních okolností cizí osobě na ulici v žádném případě nesdělil. Nemluvě o tom, že zde po dlouhou dobu probíhal jakýsi souboj mezi jednotlivými uživateli, kdo bude mít například víc přátel, kdo bude mít víc zveřejněné oblíbené muziky a kdo bude psát více a více statusů každý den. Zlatý důl pro jakoukoliv zpravodajskou organizaci byl na světě. Jestli byl před tím někdo výstřední, protože měl profil někde na webu a sdílel své osobní informace volně s ostatními návštěvníky, pak teď nastala přesně opačná situace. Pojem normalita dostal z hlediska sociálních sítí nový význam. Profil na nějaké sociální síti má více než 3 miliardy lidí s tím, že určité množství nepoužívá pouze jednu. V souvislosti s tímto obrovským počtem uživatelů, jenž na sebe každý den prozradí velmi citlivé informace, vyvstává otázka bezpečnosti těchto sítí a jejich zneužitelnosti. Jak již bylo řečeno, sociální sítě tvoří důležitý zdroj pro zisk osobních informací. Uživatelé prozrazují velké množství informací, které mohou být snadno zneužity. Typickým nešvarem je oznamování o cestě na dovolenou, kdy ve své podstatě lidé oznamují, kdy bude jejich bydliště neosídleno. Zpravodajské služby bezesporu využívají sociální sítě k zisku osobních údajů nebo k prostému prověření osob. I pro civilisty je na internetu dostupná řada nástrojů, která pomáhá sesbírat důležitá data o konkrétní osobě a dokáže vytvořit formu vztahového diagramu. Zmínil bych například dostupnou webovou stránku, která z nahrané fotografie poskytne technické údaje o obrázku, včetně typu kamery, data a místa pořízení, někdy včetně přesné GPS polohy. Našim cílem je ale naopak možnost zkreslených údajů. K výsledkům jsme došli jednoduchým průzkumem.

Navzájem jsme si vytvořili profil osobnosti z informací poskytnutých na sociální síti Facebook. Přestože oba nejsme zrovna sdílní uživatelé, dokázali jsme vytěžit poměrně důležité informace o osobním i profesním životě. Teď se však dostáváme k tomu, jakým způsobem jsou informace zkreslené. Největší množství příspěvků shodně objevujeme v období, kdy došlo k založení účtu. Jak bylo předesláno v předchozím textu, jedná se o důsledek práce s novým fenoménem, možným zařazením do chtěné skupiny, snaha o sdílení detailů našeho sociálního života. Po roce užívání nacházíme menší podíl sdílených informací a mizí statusy popisující víkendové povyražení. Po nástupu na vysokou školu dochází téměř zcela k omezení psaných statusů a postupnému snižování aktivity na síti. Každopádně rozhodli jsme se vytvořit potenciální profil osobnosti, jak by nás vnímal např. personalista při výběrovém řízení. Přestože došlo k postupné neaktivitě, stará data zůstala dostupná. Proto zcela jistě můžeme říct podrobnosti o ukončení středoškolského vzdělání, nástupu na vysokou školu, tam však další podrobnosti nenajdeme. Stejně tak osobní zájmy - středoškolské období bylo na sdílení opět bohaté, naše hodnoty se však změnily. Z aktuálnějšího období lze pochopit pouze zálibu v cestování, a to díky sdílení fotek. I to se však přesunulo na jiné sociální sítě. Když jsme shrnuli sdílené poznatky, došli jsme s trochou nadsázky k závěru, že jsme pravděpodobně věční studenti vysoké školy, kteří žijí hlavně pátečními večery a cestováním. To se v mnohém od reality odlišuje. Poučení pak přichází pro obě strany. Ti, kdo se spoléhají na data uveřejněná na Facebooku, musí počítat s mírou zkreslení, změnou strategie práce na sítí, neochotou sdělovat signifikantní události apod. Naopak uživatelé by měli zhodnotit a upravit svou Facebookovou stopu, aby nedošlo ke špatnému porozumění ze strany třetích osob. Závěr: Z našeho úhlu pohledu vnímáme potenciál data mining jako výbornou metodu, které k dokonalosti chybí kooperace s doplňujícími metodami, jež by vytěžená data pomáhaly verifikovat. Respektive data mining by mohl být nasazen ke zpětné podpoře informací. V oblasti zisku zpravodajských dat z otevřených zdrojů hrozí přesycenost informacemi, jež mohou mít za následek snížení efektivity práce, také však možné přehlédnutí důležité vazby, pomocí níž by se mohla zpravodajská služba dostat k významnému závěru. Pracují-li analytici se sociálními sítěmi, musí brát v úvahu zkreslenost údajů, které mohou být spojeny s uživatelovou on-line aktivitou. Osoby mají tendenci tvořit svůj vlastní virtuální život, jenž často neodpovídá realitě. Proto musíme na údaje získané ze sociální sítě nahlížet s vysokou mírou opatrnosti. Rádi bychom se do budoucna věnovali právě oblastí sociálních sítí, kdy vnímáme potřebu osvěty uživatelů v oblasti ochrany osobních údajů. Na to navážeme také výzkumem v oblasti zkreslení osobních údajů na internetu, což může být prospěšné jak pro lidi ve státním, tak i soukromém sektoru.

Martin Stodůlka je studentem Fakulty bezpečnostního managementu, oboru "Bezpečnostní management ve veřejné správě" a Marek Babulík je studentem Fakulty bezpečnostně právní, oboru "Strategická studia. Kontakty: 100doll@seznam.cz, BabulikMarek@seznam.cz