Dnešní témata Vědecký zákon Zákony ICT a informačního managementu Kvantitativní metody v dokumentové komunikaci Obecná, stálá, vnitřní a nutná souvislost mezi jevy a věcmi, zpravidla matematicky vyjádřitelná Typy vědeckých zákonů: zákony fungování / vývojové zákony zákony logické (teoretické) / empirické zákony VOŠIS ZIZ 4 1 VOŠIS ZIZ 4 2 Příklady: zákon fungování vývojový zákon Zákon akce a reakce Síly, jimiž na sebe vzájemně působí dvě tělesa, mají vždy stejnou velikost a opačný směr. Zákon floristické a faunistické posloupnostip Fosilní flóry i fauny následují jedny po druhých v určitém a trvalém pořádku, přičemž každá geologická formace má odlišný ráz života od formace podložní (starší) i nadložní (mladší). VOŠIS ZIZ 4 3 Příklad vývojového zákona v ICT: Historický vývoj sociální komunikace Nový typ sociální komunikace je vždy podmíněn vznikem nového média 1) řečová komunikace (jazyk) 2) dokumentová komunikace písmo rukopisy, knihtisk tisky 3) masmédia uchování a přenos obrazu, záznam a přenos zvuku hromadné sdělovací prostředky fotografie, telegrafie, telefonie, rádio, film, televize 4) elektronická komunikace počítače, informační technologie, digitalizace 5) Internet VOŠIS ZIZ 4 4 1
Inženýrské (technické) zákony Murphyho zákon 1) Zákony logické (teoretické, přírodní ) určují, jak věci v technice fungují Archimedův zákon Ohmův zákon Kirchhoffův zákon 2) Ty druhé empirická pravidla (rules of thumb) vycházejí ze zkušenosti (empirie) VOŠIS ZIZ 4 5 Edward A. Murphy, Jr. (1918 1990) letecký inženýr If there's more than one way to do a job, and one of those ways will result in disaster, then somebody will do it that way. (1949) VOŠIS ZIZ 4 6 Ranganathanovy zákony Shyali Ramamrita Ranganathan (1892 1972) indický matematik a knihovník 5 knihovnických zákonů 1. Knihy jsou určeny k užívání 2. Knihy jsou pro všechny aneb každému čtenáři jeho knihu 3. Každé knize jejího čtenáře 4. Časem čtenáře je třeba šetřit 5. Knihovna je rostoucí organismus VOŠIS ZIZ 4 7 7 ± 2 George A. Miller (3. 2. 1920) profesor psychologie na Princetonské univerzitě The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information. The Psychological Review. 1956, vol. 63, pp. 81-97. VOŠIS ZIZ 4 8 2
Pravidlo šesti stupňů oddělení six degrees of separation Steven Strogatz, Duncan Watts (2001) Platí v grafech (sítích) s velkým počtem smysluplně propojených uzlů Obecný charakter kvantitativních zákonů v ICT empirická povaha neberou v úvahu kvalitu (obsah) 1) exponenciální vzrůst (dynamické jevy) zákony rychlosti změny, vzrůstu počtu zdrojů 2) inverzní poměr / rozdělení (statické jevy objekty) zákony struktury zdrojů VOŠIS - ZIZ 54 9 VOŠIS ZIZ 4 10 1) Zákony rychlosti změny, vzrůstu počtu zdrojů Informační exploze exponenciální nárůst zdrojů informační / publikační exploze informační zahlcení ekonomika nadbytku dynamická povaha informačního prostředí (prostoru) x neměnná kapacita lidského mozku VOŠIS ZIZ 4 11 VOŠIS ZIZ 4 12 3
Informační exploze Informační exploze VOŠIS ZIZ 4 13 VOŠIS - ZIZ 54 14 Informační exploze Informační exploze VOŠIS ZIZ 4 15 VOŠIS ZIZ 4 16 4
Mooreův zákon Metcalfův zákon Gordon E. Moore (3. 1. 1929) spoluzakladatel firmy Intel Robert M. Metcalfe (1946) autor koncepce sítě Ethernet Počet tranzistorů, které lze integrovat na jeden čip, se při konstantních nákladech každý rok zdvojnásobí. Užitečnost sítě stoupá tempem, které se rovná druhé mocnině počtu jejích uživatelů VOŠIS ZIZ 4 17 VOŠIS ZIZ 4 18 Metcalfův zákon (1980) Metcalfův zákon a jeho alternativy VOŠIS ZIZ 4 19 VOŠIS - ZIZ 54 20 5
Matoušův efekt 2) Zákony struktury zdrojů Kdo má, tomu bude dáno a bude mít ještě víc, kdo nemá, tomu bude odňato i to, co má. Mat. 13,12 inverzní poměr (nepřímá úměrnost) Paretovo rozdělení (20/80) power law pozitivní ii zpětná ě vazba též: haló efekt, kumulativní efekt, pozitivní zpětná vazba (čím víc, tím víc) VOŠIS ZIZ 4 21 VOŠIS ZIZ 4 22 The Long Tail Inverzní poměr (nepřímá úměrnost) příklady Chris Anderson, šéfredaktor časopisu Wired VOŠIS ZIZ 4 23 texty tvoří malé množství slov s vysokou frekvencí výskytu a velké množství slov s nízkou frekvencí výskytu je mnoho autorů, kteří publikují málo, a málo autorů, kteří publikují hodně velké množství článků je publikováno v malém počtu časopisů čím vyšší přesnost, tím nižší úplnost VOŠIS ZIZ 4 24 6
Analýza komunikace pomocí kvantitativních (matematických a statistických) metod informetrie (infometrie) scientometrie (scimetrie) bibliometrie webometrie data mining web minig VOŠIS ZIZ 4 25 Bibliometrie předmět zkoumání: informační zdroje kolekce (soubory, fondy) dokumentů nebo údajů o nich (bibliografických citací), autoři, instituce využití kvantitativních charakteristik: správa rozsáhlých kolekcí indikace kvality kritéria relevance metody: frekvenční analýza měření relevance citační analýza VOŠIS ZIZ 4 26 Kvantifikovatelné atributy (vlastnosti) informace Zipfův zákon stárnutí nikoli s časem, ale s objevením se novější relevantnější informace ( poločas rozpadu informace) počet (množství) nově vytvořená informace nenahrazuje zcela informaci předchozí kumulativnost, exponenciální růst rozptyl seskupení relevantních dokumentů ve velkých souborech do zón podle určitého pravidla předmět: rozložení slov podle frekvence jejich výskytu v textech inverzní vztah mezi četností jevu a jeho pořadím užitná hodnota / relevance je relativní, nikoli absolutní VOŠIS ZIZ 4 27 VOŠIS ZIZ 4 28 7
Zipfův zákon Lotkův zákon Součin pořadí slov uspořádaných podle frekvence jejich výskytu v textech a jejich frekvence je konstantní. VOŠIS ZIZ 4 29 předmět: rozložení autorů podle produkce inverzní vztah mezi počtem autorů a počtem jimi publikovaných dokumentů Počet autorů s n tituly (např. knihami, články) činí cca 1/n z počtu těch, kteří jsou autory pouze 1 titulu. Podíl autorů, kteří jsou autory pouze 1 titulu, je cca 60 %, podíl autorů většího počtu titulů exponenciálně klesá. VOŠIS ZIZ 4 30 Bradfordův zákon Bradfordův zákon předmět: rozložení relevantních článků v odborných periodikách inverzní vztah mezi počtem časopisů a počtem v nich publikovaných článků Maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru. VOŠIS ZIZ 4 31 1 : n : n 2 2. zóna 1. zóna jádro 1 1 * n 1 * n 2 VOŠIS ZIZ 4 32 8
Měření relevance Relevance hodnocení výsledků vyhledávání informací relevance informační šum úplnost přesnost VOŠIS ZIZ 4 33 důležitost, závažnost (opak: irelevance, šum) vztah vyhledaného informačního objektu (zdroje, záznamu, dokumentu) a informačního požadavku (dotazu), příp. informační potřeby informace, které jsou z hlediska požadavku či potřeby důležité, jsou relevantní VOŠIS ZIZ 4 34 Typy relevance a) formální shoda kódu dotazu s kódem (selekčními údaji) dokumentu určuje vyhledávací program b) věcná vztah obsahové blízkosti dokument dotaz určuje uživatel objektivně c) pertinence vztah obsahové blízkosti dokument informační potřeba určuje uživatel subjektivně VOŠIS ZIZ 4 35 Informační šum (information noise) chyba vyhledávacího systému: nevyhledání relevantních dokumentů vyhledání d nerelevantních dokumentů ů (odpad, false drop) VOŠIS ZIZ 4 36 9
Určování formální relevance Určování věcné relevance Skórování relevance (relevance ranking): porovnání slov z dotazu se slovy v dokumentu rozsah shody četnost inverzní četnost hustota Rozdělení prohledávaného souboru na 4 podmnožiny vybráno nevybráno relevantní A B irelevantní C D VOŠIS ZIZ 4 37 VOŠIS ZIZ 4 38 Úplnost (recall, výtěžnost, rozsah) pravděpodobnost, že relevantní informační objekt bude vybrán Přesnost (precision) pravděpodobnost, že vybraný informační objekt bude relevantní počet vyhledaných a relevantních objektů celkový počet relevantních objektů v souboru počet vyhledaných a relevantních objektů celkový počet vyhledaných objektů VOŠIS ZIZ 4 39 VOŠIS ZIZ 4 40 10
Vztah nepřímé úměrnosti přesnost úplnost čím vyšší úplnost, tím nižší přesnost (a naopak) Cíl vyhledávání informací co nejvyšší úplnost (recall) a přesnost (precision) Čím více se přiblížíte úplnému zachycení celého tématu, tím více irelevantního materiálu najdete VOŠIS ZIZ 4 41 VOŠIS ZIZ 4 42 Úplnost na úkor přesnosti Přesnost na úkor úplnosti VOŠIS ZIZ 4 43 VOŠIS ZIZ 4 44 11
Přijatelný kompromis Významnost slov v textu vzhledem k vyhledávání významná slova (slova s velkou selektivní silou): mohou vyjadřovat téma dotazu a jejich použití v dotazu vymezí nějakou rozumně velkou množinu dokumentů VOŠIS ZIZ 4 45 málo významná slova: vzhledem k dané množině dokumentů vykazují velmi malou selektivní sílu tj. vyskytují se ve většině textů VOŠIS ZIZ 4 46 Selektivní síla slova Citační analýza A počet dokumentů ve fondu (zdroji, databázi) A B B počet vybraných dokumentů S = A S selektivní síla 0 nejnižší (A = B nic se nevyřadí, vybere se celý fond) 1 nejvyšší (B = 0 nic se nenajde) Optimální je selektivní síla blížící se 1 VOŠIS ZIZ 4 47 Eugen Garfield (1925) kvantifikace vztahů mezi autory, dokumenty a vědními obory na základě bibliografických citací a odkazů (referencí) využití: počet citací dokumentu impact (vliv, impakt), PageRank vztahy dokumentů (obsahová souvislost vyjádřená citací) VOŠIS ZIZ 4 48 12
Problémy citační analýzy stanovené hypotézy (obsahová souvislost, impakt faktor) platí jen v určitých sférách publikační praxe (věda, výzkum) důvodem k citování nemusí být vždy kvalita díla porušování citační etiky nepřesné uvádění citací (citace nejsou zachyceny při automatizovaném zpracování) VOŠIS ZIZ 4 49 13