Vize portálu KNIŽNÍ DATABÁZE Jakub Houžvička
Abstrakt Tato semestrální práce má pomoci seznámit s vizí projektu Knižní databáze. Jedná se o projekt v podobě webového portálu přístupnému všem uživatelům (lidem s přístupem k internetu) se zájmem o knihy, který by měl posloužit k rozšíření, lepší přístupnosti a provázanosti dat v tomto sektoru. Tato evidence je navržena komunitě. Každý uživatel se tedy bude moci podílet na obsahu. Práce je rozdělena na následující části úvod (seznámení s projektem, současný stav na českém internetu a vytyčené cíle projektu), koncept systému (návrh jednotlivých bloků portálu), způsob získání informací (jednotlivé druhy získaných informací, vložených do databáze). Klíčová slova Knižní databáze, KDB, evidence, báze, aplikace, portál, databáze, kniha, spisovatel, knihovna, knihkupectví, antikvariát, knižní bazar, nakladatelství. Abstract The semestral work should help to introduce the vision of project Book database. The project is accessible to all users (people with internet connection), who are interested in literature. This project should contribute to spreading, better accessability and connectivity of the information in this sector. All the additional information about books, writers etc. will be provided by registered users. The work is divided in following parts introduction (introduction about project, present state on Czech internet and setting project milestones), system concept (concepts of sections), data-mining (ways of obtaining and keeping information). Key words Book database, KDB, evidence, base, platform, aplication, portal, database, book, writer, library, bookshop, bookstore, book bazaar, publisher. 2
Obsah Abstrakt... 2 Klíčová slova... 2 Abstract... 2 Key words... 2 1. Úvod... 4 1.1. Současná situace... 4 1.2. Přínosy... 4 1.3. Cíle... 4 1.4. Technologie... 4 2. Struktura... 5 2.1. Webový portál (frontend)... 5 2.1.1. Hlavní stránka... 5 2.1.2. Uživatelé... 5 2.1.3. Knihy... 5 2.1.4. Spisovatelé... 6 2.1.5. Knihovny... 6 2.1.6. Bazar... 6 2.1.7. Diskuze (fórum)... 6 2.2. Administrační rozhraní (backend)... 6 3. Správa dat... 6 3.1. Základní informace... 6 3.2. Rozšiřitelné informace... 7 4. Vývoj... 7 4.1. Fáze 1... 7 4.2. Fáze 2... 7 4.3. Fáze 3... 7 3
1. Úvod V této práci jsou shrnuty základní informace o budování komplexního místa (webového portálu) zaměřující se na knižní sektor nazvaným Knižní databáze, neboli KDB. Tato databáze se má stát centrem, které by mělo objektivně zobrazovat zatříděné informace. Systém je zamýšlen jako komunita. Data budou vkládána uživateli a správci projektu budou pouze kontrolovat správnost vložených údajů, podobně jak je tomu u projektu WikipediE. Budou zde evidovány podrobné informace o knihách, spisovatelích, knihovnách, knihkupectvích, nakladatelstvích a antikvariátech. 1.1. Současná situace Pakliže chce dnes uživatel nalézt nějaké informace o nějaké knize, tak mu bohužel na českém trhu nezbývá nic jiného nežli navštívit internetový obchod, zpravidla většího knihkupectví. Tam zpravidla nalezne pouze základní informace o jim hledané knize. Bohužel ale dochází k tomu, že jednotlivá data vkládají do databáze pouze správci daného obchodu, a pak je velmi těžké rozpoznat opravdovou kvalitu knihy. Navíc je zde možno setkat i s několika zásadními problémy jako jsou: neúplnost a provázanost jednotlivých dat v rámci daného obchodu. Přičemž největší problematiku představuje nekompletnost informací, které jsou roztroušeny mezi různé servery a uživatel je musí složitě vyhledávat. 1.2. Přínosy Komplexní implementací projektu by mělo dojít k následujícím přínosům. Přehlednost soustředění nejrůznějších informací o objektech v rámci jedné evidence. Objektivnost každý uživatel se bude moci podílet na vytváření obsahu a vyjádřit tím svůj subjektivní názor, což zapříčiní onu objektivnost. Přístupnost nepřetržitá dostupnost informací o objektech pro všechny uživatele. 1.3. Cíle Cílem projektu je docílit komplexní evidence dat v oblasti knih, která uživatelům přinese požadované informace přehledně, rychle a objektivně, a co nejkvalitněji a nejrychleji tento komplexní webový portál zpracovat. 1.4. Technologie KDB bude vytvořeno na základě posledních technologických webových trendů. Výstup bude ve formátu XHTML, JavaScript a CSS. Na straně serveru bude využívána skriptovací technologie PHP. Data budou ukládána do databáze MySQL, a to přeseděvším kvůli rychlosti. Dále bude použito několik rozšiřujících technologii SEO a.httaccess (zlepšení indexace stránek). Jelikož bude zapotřebí ukládat velké množství dat, bude potřeba instalace vlastního serveru, který bude umístěn do serverhousingu a bude pracovat s operačním systémem Linux. 4
2. Struktura Projekt lze rozdělit z hlediska struktury na dva základní typy webový portál a administraci. Pro běžné uživatele bude určen a přístupen pouze webový portál, avšak pro úplný provoz projektu bude nutná i administrace pro správce, která bude zajišťovat komplexní správu zobrazovaných dat na webovém portálu. 2.1. Webový portál (frontend) Webový portál bude přístupný na internetové adrese http://www.kdb.cz. Tento portál bude roztříděn do spolu souvisejících sekcí. 2.1.1. Hlavní stránka Hlavní stránka je místem, které navštíví uživatelé zpravidla jako první. Tato stránka se tedy musí stát přehledným rozcestníkem, kde se každý z uživatelů bude schopen dostat k požadovaným informacím. Dále by tato stránka měla zobrazovat poslední knižní novinky, statistiky a ankety. 2.1.2. Uživatelé Všichni uživatelé se budou moci zaregistrovat a identifikovat se v rámci portálu, čím je umožněno jeho neustále rozšiřování (komunikace mezi uživateli, přidávání nového obsahu, zrychlení vyhledávání apod.). Uživatelé budou v registraci vyplňovat následující údaje jméno, email, uživatelské jméno a heslo. 2.1.3. Knihy Nejrozsáhlejší částí bude sekce Knihy, která se bude rozdělovat na dvě části: vyhledávací a detail vybrané knihy. Ke každé knize se budou ukládat následující data - název knihy, ISBN, nakladatel, spisovatel, kategorie, žánr, jazyk, rok vydání, anotace a formát. K těmto údajům budou moci uživatelé využívat následujících možností hodnocení, komentáře, obrázky, zajímavosti, recenze, booklet a diskuze. Pro knihkupectví, knihovny a antikvariáty zde bude možnost přiřazovat dostupnost vybraného titulu v dané organizaci. Každá kniha bude v rámci portálu evidována pouze jednou. Hlavním identifikátorem knihy v rámci databáze bude její ISBN označení. Vyhledávání Tato stránka se zobrazí po kliknutí na odkaz Knihy a bude sloužit jako vyhledávací stránka, ve které bude uživatel specifikovat své požadavky pomocí různých filtrů (základních informací o knize). Výsledkem vyhledávání bude mít podobu listu knihoven. V případě potencionální shody požadavku nebo zájmu o knihu se uživateli po kliknutí na danou knihovnu z listu zobrazí detail dané knihy. Detail knihy Na této stránce se zobrazí veškeré získané informace o dané knize a vazby (možnosti) mezi dalšími částmi v rámci portálu. 5
2.1.4. Spisovatelé Stejně jako předchozí blok tak i sekce Spisovatelé bude rozdělena na dvě části a to: vyhledávací a zobrazující detail daného objektu. Tímto způsobem budou řešeny i další sekce nazývající se: knihovny, knihkupectví, nakladatelství a antikvariáty. U části Spisovatelů se v databázi budou evidovat tyto informace jméno, národnost, biografie, datum narození a případně také datum úmrtí spisovatelů, a samozřejmě jimi napsané tituly. 2.1.5. Knihovny Ke knihovnám a veškerým organizacím (knihovny, knihkupectví, nakladatelství a antikvariáty) budou evidovány v rámci KDB tyto údaje název instituce, adresa, IČO, kategorie, telefon a email. Každá organizace má mírně odlišný přístup či zaměření, což bude zohledněno i v detailu organizace. 2.1.6. Bazar Do této části budou moci uživatelé vkládat své nabídky k prodeji či ke koupi titulů. 2.1.7. Diskuze (fórum) Každý přihlášený uživatel se bude moci připojit do diskuze, která bude roztřízena do sekcí a moderována správci. 2.2. Administrační rozhraní (backend) Administrační rozhraní je informační systém, ke kterému mají přístup pouze správci projektu a bude přístupný online na internetu. Důraz bude kladen na zabezpečení přístupu k systému. Správci budou mít různá oprávnění do jednotlivých sekcí (modulů), které lze rozlišit na - zobrazení, přidání, upravení a smazání. Všechny údaje zobrazované z databáze na webovém portálu bude možné přes tuto administraci spravovat. 3. Správa dat Téměř všechny webové portály databázového typu (evidence) jsou hodnotné právě díky množstvím ucelených a provázaných kvalitních dat - stejně tak tomu bude i u KDB. Po technickém zpracování portálu bude muset dojít k vložení základních informací, které později budou moci uživatelé dále rozšiřovat. 3.1. Základní informace Většina základních údajů o knihách, spisovatelích a organizacích je již evidována v rámci knihovnického systému Aleph. Tento většinou volně přístupný systém používá téměř každá větší knihovna. Proto budou základní informace z těchto zdrojů stažena a následně upravena do formy vhodné pro daný portál. V posledním kroku dojde k provázání dat tj. přiřazení knih k autorům, roztřídění záznamů do vhodných kategorii apod. Tyto základní informace budou moci vkládat i sami uživatelé ve formuláři k tomu určeném. 6
3.2. Rozšiřitelné informace Naopak tyto informace budou tvořeny výhradně návštěvníky portálu. Pakliže budou uživatelé na detailu záznamu a budou o něm vědět více nebo se o něho zajímat, tak zde bude možnost rozšířit databázi pomocí vložení rozšiřujících informací přes určený formulář. Zařazení těchto informací do databáze bude podléhat schválení správce, který bude provádět kontrolu nových dat (stylistika, pravopis). Odpovědnost za správnost dat nebude pouze na správci, ale i na jejich tvůrcích. Detailnější informace budou moci vkládat i organizace tj. knihovny, knihkupectví a antikvariáty, které budou moci takto informovat potencionální zákazníky např. o dostupnosti svých titulů. Pro tento účel budou vytvářet zvláštní soubory, které budou automaticky stahovány pravidelně každý den ze stránek dané organizace. 4. Vývoj 4.1. Fáze 1 Samotná myšlenka (vize) Knižní databáze začala vznikat v červenci 2008. Od té doby až zhruba do začátku října docházelo k sepisování návrhu a následnému napsání podrobné technické specifikace. 4.2. Fáze 2 Hned po skončení prací na návrzích přišla řada na část implementační, která bude dle předpokladů dokončena zhruba koncem března 2009. Souběžně s implementací dochází k přidávání základních informací do databáze a instalace a umístění serveru do serverhousingu. 4.3. Fáze 3 Po dokončení předchozích částí nastane období údržby, které bude sloužit především ke kontrole a korekci implementačních chyb, správě dat a vývoji nových částí. 7