Využití RSS pro personalizované doručování článků z vědeckých časopisů



Podobné dokumenty
RSS : RSS

Systém elektronického rádce v životních situacích portálu

CSS. SEO Search Engine Optimization (optimalizace pro vyhledávače)

Obsah. Kapitola 1 Seznamte se s RSS Kapitola 2 Získávání RSS-zpráv pomocí čteček Úvod...9

Tvorba webu. Úvod a základní principy. Martin Urza

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Databázové aplikace pro internetové prostředí PHP úvod, základní princip, vkládání skriptu, komentáře, výpis na obrazovku

Citace.com. návod na využívání generátoru citací. Místo vydání: Brno Vydavatel: Citace.com Datum vydání: Verze:

HTML Hypertext Markup Language

PRODUKTY. Tovek Tools

Manuál pro obsluhu Webových stránek

Produktový list Zboží.cz. PPC reklama Internetová reklama placená za proklik

Registrační číslo projektu: Škola adresa:

METODICKÝ POKYN PRÁCE S PORTÁLEM DUMY.CZ. Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.

ANL+ Veronika Ševčíková Národní knihovna ČR

Internetový prohlížeč-vyhledávání a ukládání dat z internetu do počítače

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

Strategie ochrany před negativními dopady povodní a erozními jevy přírodě blízkými opatřeními v České republice

Jihočeská univerzita v Českých Budějovicích. Název bakalářské práce v ČJ Název bakalářské práce v AJ

CZ.1.07/1.5.00/

INTERNET A SÍTĚ. Role při tvorbě webových aplikací. Rozhodovací vrstvy při tvorbě webových aplikací. povrch kostra struktura obsah strategie

Rešeršní služby v Ústřední knihovně ČVUT

Modul MWA - Publikace a články

Vyhledávání v citační databázi Web of Science (WOS)

VYHLEDÁVACÍ BANNER PRO WEBOVÉ STRÁNKY

WORKWATCH ON-LINE EVIDENCE PRÁCE A ZAKÁZEK

Uživatelský manuál. Aplikace GraphViewer. Vytvořil: Viktor Dlouhý

PHP PHP je skriptovací programovací jazyk dynamických internetových stránek PHP je nezávislý na platformě

The bridge to knowledge 28/05/09

Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání

Olga Rudikova 2. ročník APIN

EBSCO. Poklikneme na možnost EBSCOhost Web. Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat.

XML Práce s řídicím souborem miniaplikace

Mgr. Vlastislav Kučera Struktura stránky, hlavička,

RSS NÁVOD K POUŽITÍ. Na internetu lze najít spoustu jednoduchých RSS čteček. Níže pár samostatných specializovaných programů:

Tvorba WWW stránek. Mojmír Volf

Kapitola 1 První kroky v tvorbě miniaplikací 11

CSA Library School Program RefWorks v ČR. Eva Marvanová Národní knihovna ČR

Citační manager - Zotero. Mgr. Ilona Trtíková

Vyšší odborná škola a Střední škola s.r.o. České Budějovice Pražská 3 ABSOLVENTSKÁ PRÁCE Vlastimil Bečvář

Do knihovny skrze webový prohlížeč

T-Cloud Zakázka. Uživatelská příručka

Produktový manuál.

Vložení identifikátorů DOI, UT WOS, UT SCOPUS a PubMed ID do záznamu

1 ZÁKLADNÍ FUNKCE SYSTÉMU

Přebírání ohlasů z WoS a Scopus. Josef Klimeš

Studijní informační zdroje

Manuál PVU dodavatel Platnost pro elektronický nástroj X-EN verze 3 a novější

Národní elektronický nástroj. Import profilu zadavatele do NEN

Inovace výuky prostřednictvím šablon pro SŠ

Mgr. Vlastislav Kučera přednáška č. 2

Vytvoření portálu odboru strukturálních fondů Ministerstva vnitra a zajištění jeho hostingu na serveru dodavatele

Nové přístupy tvorby web site. Doc. Ing. Zdeněk Havlíček, CSc. KIT PEF CZU - 13/11/2001

TNPW1 Cvičení aneta.bartuskova@uhk.cz

Úvod do elektronických informačních zdrojů

Základní informace o světových, českých a čínských vyhledávačích, seznámení s RSS technologií

Informační vzdělávání PdF

SharePoint Vysoká škola zdravotnická, Duškova 7, Praha 5. Školní informační portál 1/7. Přihlášení k portálu

Mgr. Vlastislav Kučera lekce č. 2

SEO OPTIMALIZACE PRO VYHLEDÁVAČE JEDNODUŠE

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

7. SEO Nástroje pro analýzu úspěšnosti. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Redakční systém Joomla. Prokop Zelený

ORCID. Návod na založení globálního identifikátoru vědce. (vytvořeno )

Tvorba fotogalerie v HTML str.1

Publikování map na webu - WMS

HTML - Úvod. Zpracoval: Petr Lasák

Athena Uživatelská dokumentace v

Informační kanály a signální zdroje. Information channels and signal sources

Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. PORTÁL KUDY KAM. Manuál pro editaci ŽS. Verze 1.

Maturitní projekt do IVT Pavel Doleček

Manuál pro implementaci aplikace Na poštu

Vyšší odborná škola a Střední škola,varnsdorf, příspěvková organizace. Šablona 4 VY 32 INOVACE

1 Administrace systému Moduly Skupiny atributů Atributy Hodnoty atributů... 4

Úvod do tvorby internetových aplikací

Uživatelská dokumentace

Část 1 - Začínáme. Instalace

ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA

STŘEDNÍ ŠKOLA INFORMAČNÍCH TECHNOLOGIÍ A SOCIÁLNÍ PÉČE

APLIKACE XML PRO INTERNET

1. Umístěte kurzor do sloupce Datový typ na řádek s polem, ve kterém vytvořit chcete seznam.

Systém JSR představuje kompletní řešení pro webové stránky malého a středního rozsahu.

1. DATOVÉ SCHRÁNKY OBECNÝ PŘÍSTUP K DATOVÉ SCHRÁNCE DATOVÉ ZPRÁVY... 3

Uživatelská příručka 6.A6. (obr.1.)

NSWI096 - INTERNET. Úvod do HTML

Specifikace rozhraní. Oznamovací povinnost podle zákona č. 307/2013 Sb., ve znění pozdějších předpisů. Martin Falc, SW architekt.

Manuál PVU dodavatel Platnost pro elektronický nástroj X-EN verze 3 a novější

Úvod do aplikací internetu a přehled možností při tvorbě webu

Název: On-line tvorba webu Anotace:

Pokročilé techniky tvorby sestav v Caché. ZENové Reporty

36 Elektronické knihy

WEBOVÉ STRÁNKY

PŘÍRUČKA. Správa obsahu webové prezentace. Formátování textu

Využití Oborové brány TECH

E-knihy Nakladatelství Karolinum. Mgr. BcA. Vít Krobot

ISI WEB OF SCIENCE - manuál

Transkript:

Využití RSS pro personalizované doručování článků z vědeckých časopisů Martin Krčál * krcal@fss.muni.cz Abstrakt: Příspěvek pojednává o možnosti využití RSS kanálů pro potřeby personalizovaného doručování článků z vědeckých časopisů. V první části autor popisuje technologii RSS a probírá specifikaci RSS 2.0. Ve druhé části se zamýšlí nad fungováním systému pro stahování článků z RSS kanálů vědeckých a odborných časopisů a jejich následným vyhledáváním a doručováním do RSS čteček. V závěru pak nabízí další možnosti vylepšení a napojení na jiné již existující webové služby. Klíčová slova: RSS, specifikace RSS, webové služby, personalizované doručování článků 1 Úvod Distribuce informací prostřednictvím RSS kanálů se stala v poslední době velmi populární. RSS kanály lze nalézt nejen u velkých zpravodajských serverů, blogů a dalších často aktualizovaných stránek, ale v poslední době je začali využívat i někteří vydavatelé. Takové RSS kanály obsahují název, popis článku (často ve formě anotace), odkaz na časopis, seznam článků, které se v něm nacházejí (většinou z aktuálního čísla nebo výběr těch nejlepších), linky na konkrétní články (na volně dostupný fulltext nebo anotaci), případně údaje o autorovi. K podobné praxi se odhodlali také tvůrci významných databází článků a časopisů. Za všechny jmenujme alespoň časopisy z Oxford University Press nebo Wiley. Informace z těchto zdrojů lze využít při personalizovaném doručování článků, ale také v dalších službách. 2 Technologie RSS 2.1 Co je RSS RSS (Really Simple Syndication) je standardizovaný formát založený na XML, který umožňuje jednoduché sdílení obsahu na internetu. Vznikl již v roce 1999, svou popularitu však získává teprve v posledních letech. V čem je RSS tak skvělé? Jeho největší výhoda spočívá v jednoduchosti použití. Tvůrce stránky vygeneruje RSS kanál, do kterého uloží informace o zdrojovém dokumentu. Díky tomu, že jde o standardní formát, je poměrně dobře strojově zpracovatelný. Navštíví-li uživatel stránky a stáhne-li si RSS kanál do své RSS čtečky, může nepřetržitě sledovat, co je na stránkách nového bez toho, aby stránky znovu navštívil. Mohlo by se zdát, že to postihne návštěvnost daného serveru, ale opak je pravdou. Uživatelé tím, že mohou sledovat novinky ve své čtečce, udržují kontakt se stránkami a pravidelně se na ně vracejí, čímž jejich návštěvnost zvyšují. Samozřejmě obsah RSS kanálů nemusíme sledovat jen ve čtečkách. RSS kanál je vlastně XML dokument, a proto jeho obsah můžeme velmi jednoduše zobrazovat také na webových stránkách a doplňovat jej o další služby jako např. personalizované zobrazování zpráv. Dobrým příkladem využití RSS kanálů na webových stránkách může být služba Právě dnes monitoring zpravodajství (http://www.pravednes.cz), která shromažďuje zprávy ze všech významných českých * Masarykova univerzita, Fakulta sociálních studií, Ústřední knihovna, Joštova 10, 602 00 Brno 1

zpravodajských serverů. Po registraci si můžeme vytvořit vlastní stránku se zdroji, které nás zajímají a které chcete sledovat. S první veřejně publikovanou verzí RSS přišel Netscape (verze 0.9). Širší uplatnění však našla až její úprava 0.91. Po ní přišla verze 1.0, která byla stejně jako v0.9 založena na specifikaci RDF. V současné době existuje RSS ve verzi 2.0 (resp. 2.0.1), která je kompatibilní s 0.91 (přibyly jen některé nepovinné prvky). Zároveň jde o nejčastěji užívané verze na webu. RSS kanály bývají na stránkách označeny těmito ikonami: 2.2 Specifikace RSS 2.0 Jak již bylo řečeno výše, RSS je založeno na XML, proto musí dodržovat jeho specifikaci. XML dokument by měl být kódován v UTF-8 a stejně tak je tomu i u RSS kanálů. Každý RSS dokument obsahuje povinné a nepovinné prvky. Musejí být vždy párové (uzavřené) a některé jsou opakovatelné. Vybrané prvky mohou obsahovat upřesňující parametry. Základními povinnými prvky jsou: <rss> - kořenový prvek obsahující parametr version, ve kterém se uvádí verze RSS. Tento údaj je velmi důležitý, neboť umožňuje stažení dat ve správném formátu. <channel> - je vnořený do prvku <rss> a je nositelem informací. Obsahuje nejen popisná metadata RSS kanálu, ale také samotný obsah kanálu v prvku <item>. Všechny další níže popsané prvky jsou již vnořeny do prvku <channel>. K dalším povinným prvkům patří: <title> - jméno kanálu, často to bývá název stránky. Pokud jde o RSS kanál článků z konkrétního časopisu, často zde bývá právě jeho název. <link> - URL adresa daného RSS kanálu (včetně http://, ftp:// apod.). <description> - tento prvek slouží k popisu kanálu. Mimo to může <channel> obsahovat ještě nepovinné prvky: <language> - umožňuje definovat jazyk RSS kanálu. Bohužel zápis jazyka nevychází z žádné normy, ale užívají se vlastní zkratky jazyků, které vytvořil a spravuje Netscape. Jejich seznam najdete na adrese: http://blogs.law.harvard.edu/tech/stories/storyreader$15. Pro češtinu se užívá zápis cs. <copyright> - informace o autorských právech pro data v RSS kanálu. <managingeditor> - email na osobu, která je zodpovědná za informace v RSS kanálu. <webmaster> - email na osobu, která je zodpovědná za technické záležitosti provozu RSS kanálu. <pubdate> - datum vytvoření obsahu v RSS kanálu. Formát pro zápis data a času lze nalézt ve specifikaci RFC 822 v kapitole 5 - Date and Time Specification (http://www.faqs.org/rfcs/rfc822.html). http://blogs.law.harvard.edu/tech/rss 2

<lastbuilddate> - datum poslední změny obsahu RSS kanálu. Formát zápisu je stejný jako u prvku <pubdate>. <category> - řadí kanál do jedné nebo více kategorií, může obsahovat parametr domain, který popisuje taxonomii kategorií. <generator > - název programu nebo aplikace, která RSS kanál vytvořila. <docs > - odkaz na dokumentaci, podle níž byl RSS kanál vytvořen (URL na specifikaci použité verze RSS) <cloud> - může obsahovat parametry domain, port, path, registerprocedure a protocol. <ttl> - určuje jak dlouho může být kanál cacheován před novou aktualizací zdroje. Zadává se celé číslo, které vyjadřuje počet minut. <image> - definuje obrázek, který se má zobrazovat u daného RSS kanálu. Obrázek může být ve formátu JPG, GIF nebo PNG. Prvek obsahuje tři povinné a stejný počet nepovinných prvků: <url> - URL obrázku, povinný prvek. <title> - popisek obrázku, který se v HTML zobrazuje u tagu <img> v parametru ALT, povinný prvek. <link> - URL stránky. Při vykreslení kanálu je obrázek zároveň odkazem na stránky. V praxi by měl mít stejnou hodnotu jako link kanálu. Jde o povinný prvek. <width> - šířka obrázku v pixelech, výchozí hodnota je 88, maximální hodnota 144, nepovinný prvek. <height> - výška obrázku v pixelech, výchozí hodnota je 31, maximální hodnota 400, nepovinný prvek. <description> - popisek obrázku, který se v HTML zobrazuje u tagu <img> v parametru TITLE, nepovinný prvek. <rating> - hodnocení kanálu podle PICS (Platform for Internet Content Selection). Více informací o PICS najdete na adrese: http://www.w3.org/pics. <textinput > - specifikuje formulářové textové vstupní pole, které může být zobrazeno spolu s obsahem kanálu. Nenachází příliš velké uplatnění a většina agregátorů ho ignoruje. V praxi by měl sloužit třeba k získávání zpětné vazby od čtenářů. Může obsahovat tyto nepovinné prvky: <title> - popisek odesílacího tlačítka ve formuláři. <description> - popisek formulářového textového vstupního pole. <name> - jméno textového objektu. V HTML se zobrazí jako parametr name u formulářového pole. <link> - odkaz na skript, který spustí požadavek po odeslání formuláře (ve specifikaci se uvádí, že musí jít o CGI skript). <skiphours> - definuje hodiny, ve kterých by neměl být obsah stahován. Tento prvek může nabývat hodnot 0-23. <skipdays > - definuje dny v týdnu, ve kterých by neměl být obsah stahován. Tento prvek může nabývat hodnot: Monday, Tuesday, Wednesday, Thursday, Friday, Saturday a Sunday. <item> - prvek, který nese obsah kanálu. Je libovolně opakovatelný. Obsahuje další vnořené prvky, které jsou nepovinné. Vždy ale musí být uveden alespoň prvek <title> nebo <description>. <title> - titulek položky. 3

<description> - výtah z obsahu položky. <link> - URL odkazující na položku. Většinou jde o odkaz na plný text. <author> - emailová adresa na autora textu (článku), v závorce může být uvedeno i jeho jméno. <category> - řadí položku do jedné nebo více kategorií, může obsahovat parametr domain, který popisuje taxonomii kategorií. <comments > - URL stránky odkazující na komentáře k položce. <enclosure> - popisuje přílohy, které jsou vložené k položce. Obsahuje povinné parametry url (URL přílohy), length (velikost přílohy v bytech), type (typ přílohy, standardně MIME type). <guid> - globální jednoznačný identifikátor položky. Pomáhá čtečkám rozhodovat, zda je daná položka nová. Specifikace neurčuje přesný formát tohoto prvku, ale musí vždy jít o řetězec. Může být zapsán ve formě URL adresy nebo lze zadat jiný jednoznačný identifikátor (např. DOI, URI, ). Prvek může obsahovat parametr ispermalink, který definuje, zda jde o permanentní odkaz, jenž lze otevřít v prohlížeči (hodnota true), případně dočasný odkaz nebo jiný než URL identifikátor (hodnota false). Primárně je tomuto parametru nastavena hodnota true. <pubdate> - datum zveřejnění položky. Formát pro zápis data vychází opět ze specifikace RFC 822 (viz výše). <source> - jméno RSS kanálu, z něhož položka pochází. Může obsahovat parametr URL s odkazem na zdroj. 2.3 RSS validátory Validátory lze definovat jako nástroje, které určují správnost zápisu zdrojového kódu na základě porovnání se standardy. Většinou jsou dostupné prostřednictvím internetu, a pak mluvíme o tzv. online validátorech. Některé jsou zakomponovány přímo do internetových prohlížečů (např. v Opeře nebo formou rozšíření ve Firefoxu). Fungují tak, že se do formulářového pole zadá URL dokumentu, u něhož chceme prověřit validitu, a systém vygeneruje chyby, případně zobrazí hlášku, že dokument je validní. Existuje velké množství validátorů na různé typy dokumentů. Za všechny jmenujme alespoň validátory na kontrolu zdrojového kódu webových stránek (XHTML, HTML), kaskádových stylů (CSS), XML, RDF, Atom atd. Svůj validátor má také RSS. Jde o Feed Validator od Marka Pilgrima, který lze nalézt na adrese http://www.feedvalidator.org. Slouží ke kontrole RSS ve verzích 0.90, 0.91, 0.92, 0.93, 0.94, 1.0, 1.1 a 2.0. V současnosti podporuje také Atom 0.3 a v betaverzi Atom 1.0. Validátory nejsou bezchybné. Jde jen o strojovou analýzu struktury dokumentu. Přesto hrají neocenitelnou roli při tvorbě dokumentů a dokáží ušetřit čas při odhalování chyb. 3 Systém pro personalizované doručování odborných článků z RSS zdrojů 3.1 Stahování dat z RSS kanálů V první fázi je nutné vytipovat si vhodné RSS kanály. V našem případě by mělo jít o RSS kanály odborných časopisů nebo specializovaných databází článků. Měly by mít kvalitní obsah a hlavně jejich zdrojový kód musí být validní se specifikací RSS. Validitu zdrojového kódu lze ověřovat pomocí Feed Validatoru. Nové odkazy na RSS kanály by do systému vkládali správci služby, případně by na ně mohli upozorňovat sami uživatelé např. odesláním odkazu na RSS zdroj prostřednictvím webového formuláře. Tyto zdroje od uživatelů by však měly procházet schvalovacím procesem se zaměřením na kontrolu relevance zdroje a 4

samozřejmě na kvalitu zdrojového kódu (bylo by možné kontrolovat automaticky pomocí vestavěného validátoru). Informace o zdrojích se budou ukládat do databáze. Bude nutné uchovávat zejména název zdroje (<title>) - v našem případě by to měl být název časopisu, jeho URL adresu (<link>) a informace o tom, kdy je zdroj aktualizován. Dále se může ukládat popis kanálu (<description>), jazyk (<language>), informace o autorských právech (<copyright>), kontakt na správce obsahu (<managingeditor>), datum poslední aktualizace (<lastbuilddate> případně <pubdate>) a předmětové kategorie (<category>). Asi nejdůležitějším údajem pro nás bude frekvence aktualizace zdroje. Na základě toho se budou informace stahovat. Bude-li tedy RSS kanál aktualizován vždy 23. den v měsíci, spustí se automaticky vždy tento den skript, který ověří, zda již zdroj obsahuje nové informace (podle prvků <lastbuilddate> a <pubdate>) a pokud ano, obsah stáhne do vlastní databáze. Nebude-li obsah ještě aktualizován, zopakuje proces třeba o den později. Dále se musí prověřit, zda již článek v databázi z tohoto zdroje není. K tomu potřebujeme jednoznačně identifikovat článek (data v prvku <item>). Můžeme využít prvek <guid>, případně porovnat název (<title>) a odkaz na článek (<link>). Problém při ověřování by mohl nastat ve chvíli, kdy by nebyl vyplněn žádný z těchto prvků. Pak by se články z tohoto zdroje nestahovaly. K tomu však bude docházet pouze výjimečně. Snad všechny zdroje, které jsem prověřoval, měly v prvku <title> (u <item>) zadaný název článku. Nyní se zaměřme na to, jaká data budeme stahovat u jednotlivých článků. Ideální by bylo stahovat obsah všech vnořených prvků prvku <item>. To ale není v praxi vždy možné, protože ne každý producent RSS kanálů vyplňuje všechny položky. Pro provozování naší služby jsou klíčové prvky <title>, <link>, <description> a <pubdate>. Pro případné vyhledávání by bylo dobré stáhnout kategorie (<category>). Diskutabilní je stahování prvku <author>, kde se primárně zadává emailová adresa autora článku. Jméno autora se pak může zadat do závorky. Většinou tento údaj vyplněn nebyl. Budeme-li vycházet z toho, že většina uživatelů hledá článek podle klíčových slov a předmětových hesel, pak není tento údaj příliš důležitý a stahovat jej můžeme jen v případě, je-li uveden. Jak je ze specifikace RSS 2.0 patrné, naprosto chybí prvek pro označení ročníku a čísla časopisu, v němž se článek nachází. Tvůrci RSS kanálů to řeší různě. Nejčastěji tento údaj vůbec neuvádějí. U RSS zdrojů časopisů publikovaných The University of Chicago Press se ročník a číslo uvádí přímo v prvku <title> a jsou odděleny od názvu článku dvojtečkou. Setkal jsem se také s tím, že byly tyto údaje uvedeny v prvku <description>. Otázkou zůstává, zda je tento údaj důležitý ve chvíli, kdy máme k dispozici odkaz na článek, případně na stránky časopisu, kde je informace o ročníku a čísle většinou uvedena. Asi největší problém nastane při pokusu o sjednocování záznamů. Příkladem může být výše zmíněné uvádění ročníku a čísla v prvku <title> u časopisů z vydavatelství The University of Chicago Press. Tady bude zřejmě nutné ošetřit nejčastější varianty zápisu při stahování informací do vlastní databáze nebo je vkládat v takovém stavu, v jakém jsou uvedeny a zohlednit to při vyhledávání. 3.2 Co dále s uloženými daty Stáhneme-li obsah RSS zdroje do databáze našeho systému, můžeme přemýšlet, jak s ním dále naložíme. Jako první se nabízí vytvořit vyhledávací rozhraní. Vyhledávat články by mělo jít podle slov z názvu nebo dle klíčových slov. Tomu samozřejmě musí předcházet indexace prvků <title>, <description> a zpracování výrazů v položce <category>. Systém by měl disponovat jednoduchým a pokročilým vyhledáváním. Mohl by využívat některé další funkce jako našeptávač z databáze EBSCO apod. 5

Uživatel by také měl mít možnost vybrat si zdroje, které ho zajímají. Na základě toho by si vytvořil vlastní RSS kanál, jehož prostřednictvím by si mohl informace ze svých oblíbených zdrojů zobrazovat ve vlastní čtečce a samozřejmě také v systému na své personalizované stránce. Obdobně by mohla fungovat tzv. výstřižková služba. Uživatel by si v systému zadal klíčová slova, která ho zajímají. Jakmile by se do systému vložil článek, který odpovídá zaměření uživatele, systém by ho automaticky vložil do osobního RSS kanálu uživatele a tomu by se okamžitě zobrazil v jeho čtečce a samozřejmě také na jeho personalizované stránce. Klíčová slova by si mohl průběžně měnit. Navíc by měl uživatel k dispozici hodnocení jemu zobrazených článků. Na základě tohoto hodnocení by systém uživateli nabízel i podobné články, které by nespadaly do jeho původního výběru klíčových slov, ale odpovídaly by jeho zaměření a zájmům. Hodnotit by se samozřejmě daly všechny články. Mohl by existovat žebříček nejlépe hodnocených, ale třeba také nejčtenějších článků. Podle toho by šlo sestavovat nejčtenější zdroje (časopisy) apod. Články by mohli uživatelé hodnotit také slovně formou recenzí a komentářů. Zkrátka vytvořilo by se prostředí pro výměnu informací o kvalitních odborných textech založených na principu dnes stále populárnějšího Webu 2.0. 3.3 Propojení s externími službami Zapomenout nemůžeme ani na spolupráci s dalšími externími službami. V prvé řadě je možné vyhledávat články a časopisy v knihovnách např. prostřednictvím Jednotné informační brány (http://www.jib.cz). Službu lze prolinkovat s různými databázemi článků (EBSCO, Proquest, apod.), případně se službami pro paralelní vyhledávání časopisů v těchto zdrojích jako je např. JaMM Journals (http://www.jammworld.com). Záznamy by mohly být exportovány do citačního softwaru (např. RefWorks), případně do Generátoru citací (http://www.citace.com). Podobných propojení služeb by šlo určitě nalézt více. 4 Závěr Možnosti využití stále populárnějších RSS kanálů jsou velké. V tomto příspěvku jsem se snažil nastínit alespoň jeden způsob, který by mohl oživit kdysi tak populární výstřižkovou službu. Samozřejmě systém asi nikdy nebude dokonalý. V prvé řadě nelze pokrýt všechny časopisy. Ne každý vydavatel a producent prezentuje články nebo alespoň obsahy svých časopisů prostřednictvím RSS kanálů. Navíc při personalizovaném vyhledávání vždy záleží na správnosti zadaných klíčových slov a samozřejmě na správné indexaci článků systémem. Přesto si myslím, že pro řadu vědců a odborníků by takový systém znamenal obrovskou úsporu času a byl by přínosem pro jejich práci. Použitá literatura a WWW odkazy 1. RSS 2.0 Specification [online]. Aug. 12, 2006 [cit. 2007-04-04]. Dostupný z WWW: <http://www.rssboard.org/rss-specification>. 2. RSS. Wikipedia : The Free Encyclopedia [online]. 27 September 2002, [cit. 2007-04-04]. Dostupný z WWW: <http://en.wikipedia.org/wiki/rss_(file_format)>. 3. BUREŠ, Jiří. RSS? RSS!. Interval.cz [online]. 4.3.2003 [cit. 2007-04-04]. Dostupný z WWW: <http://interval.cz/clanky/rss-rss>. ISSN 1212-8651. 4. BUREŠ, Jiří. RSS 2.0. Interval.cz [online]. 16.9.2004 [cit. 2007-04-04]. Dostupný z WWW: <http://interval.cz/clanky/rss-2-0>. ISSN 1212-8651. 6

5. KING, Andrew B. Introduction to RSS. WebReference.com [online]. March 27, 2000, revised April 14, 2003 [cit. 2007-04-04]. Dostupný z WWW: <http://www.webreference.com/authoring/languages/xml/rss/intro/>. 6. LEWIN, James. Content feeds with RSS 2.0. IBM [online]. 23 Dec 2003 [cit. 2007-04-04]. Dostupný z WWW: <http://www-128.ibm.com/developerworks/xml/library/x-rss20>. 7. http://www.bytowninternet.com/glossary 8. http://www.anvilmediainc.com/search-engine-marketing-glossary.html 7