Tvorba jednoduchých WWW stránek Daniela Ďuráková VŠB- Technická univerzita Ostrava Katedra informatiky
Vznik WWW technologie Vznik- CERN 1989-90, vedoucí projektu Tim Berners-Lee Cíl- infrastruktura pro sdílení výsledků vědeckých výzkumů Vyvinutá technologie protokol HTTP adresování objektů pomocí URL adres jazykhtml
World Wide Web WWW služba počítačové sítě Internet je založena na principech: prezentace informací pomocí grafického rozhraní, uložení informací ve formátu textových dokumentů, zdrojové soubory obsahují čistý text(příkazy,...), odkazy na části dokumentů, jiné dokumenty, obrázky, zvukové sekvence, videosekvence ap. nezávislost na platformě při zobrazování(windows, UNIX, Linux, a další)
World Wide Web Tvorba pomocí speciálního jazyka HyperText Markup Language (HTML), který umožňuje používání odkazů, značkovací jazyk založený na SGML pro popis struktury webových stránek Pro prezentaci dokumentů se používají prohlížeče, které umožňují zobrazit WWW stránku v grafické podobě. Vytvořenédokumentyjsoupřístupné celémusvětu (nainternetu). Anglickéoznačení web charakterizujeprávěpropojenídokumentů pomocí odkazů. Soubory vytvořené pomocí jazyka HTML mají typicky příponu.html, případně.htm.
HTTP- Hypertext Transfer Protocol protokol pro přenos stránek mezi webovým serverem a prohlížečem jednoduchý aplikační protokol vystavený nad protokolem TCP několikverzí-http0.9,http1.1,http3.0ažhttp4.01 Průběh vyřízení požadavku 1. navázání spojení 2. zaslání požadavku klientem 3. zaslání odpovědi serverem 4. uzavření spojení V případě stránek s mnoha vloženými objekty(obrázky apod.) může být vyřízení požadavku pomalé. Novější verze HTTP umožňují během jednoho spojení vyřídit několik požadavků/odpovědí.
URL- Uniform Resource Locator URL je adresa, jednoznačně identifikuje zdroj v rámci Internetu URLpoužíváseveslužbáchWWW,FTP,e-mail,telnet,... Struktura URL Jednoznačná adresa v rámci internetu identifikuje různé objekty zdroje, aťsejednáowebovéstánky,e-mailovéadresy,soubory,... URL má(většinou) následující tvar: http://www.vsb.cz/cz/vitejte/areal.html kde význam jednotlivých částí je následující: http znamená typ protokolu, který zajišťuje přenos stránek umístěných na webovém serveru na počítač uživatele. Dnes se používá i protokol https, což je stejný protokol jako http, pouze přenášená data jsou kryptována(zabezpečená).
www.vsb.cz je jedinečné označení(zde jméno) serveru v rámci Internetu, které je tvořeno z částí: www názevserveruvrámcivšb, vsb vrámcičeskédoménydoménavsb(vysokáškolabáňská), cz označení národní či jinak světově registrované domény (v našem případě české) /cz/vitejte/ další část URL je cesta k patřičným dokumentům v adresářovém systému serveru, areal.htm název konkrétního dokumentu. / oddělovače jednotlivých částí adresy.
HTML- Hypertext Markup Language značkovací jazyk založený na SGML pro popis struktury webových stránek nezávislý na platformě Historie a vývoj HTML HTML0.9-1991 Tim Berners-Lee- členění textu do několika logických úrovní, použití několika druhů zvýraznění textu, lze zařadit odkazy a obrázky HTML 2.0 první formální specifikace- IETF(Internet Engineering Task Force) návrh standardu- označován HTML 2.0, plně vyhovuje norměsgml(iso8879zroku1986), základní formátování a strukturování dokumentu, obrázky, formuláře.
HTML 3.0-1995 návrh standardu Dave Raggett z laboratoří Hawlett-Packard formalizoval HTML+, vytvořil jeho deklaraci DTD(Document Type Declaration) v jazyku SGML(Standard Generalized Markup Language) HTML3.2-1996 výrobci prohlížečů přidávají nestandardní rozšíření HTML, konsorcium W3C proto vybírá společnou podmnožinu rozšíření a schvaluje HTML 3.2 lepší možnosti formátování dokumentu HTML4.0-1997 podpora kaskádových stylů, rámy skripty vložené do stránky, multimediální objekty rozšířené možnosti tabulek, formulářů i18n(podpora více jazyků, tok textu zleva doprava) podporu HTML 4.0 mají prohlížeče(ie6, NN7, O7, M1.6).
HTML4.01-1999 opravy drobných chyb ve specifikaci HTML 4.0
Verze XHTML X ve zkratce XHTML vzniklo ze slova extensible, což by mělo znamenat rozšíření. Skutečnost je opačná, počet použitelných prvků se snížil. JeproduktempřetvořeníHTML4aXML1. Dnes se používá XHTML ve třech verzích: XHTML 1.0 přechodové(transitional) XHTML 1.0 striktní(strict) XHTML 1.1 XHTML 1.0 strict je oproti trans pracnější, XHTML 1.1 je okleštěno proti HTML o nestandardní prvky.
Požadavky pro tvorbu a zpřístupnění WWW stránek Vytvoření vlastních WWW dokumentů znamená zvládnout techniku tvorby a rozumět jednotlivým aspektům, nutných k prezentaci WWW stránek. 1. Editor, který umí pracovat s čistým ASCII textem,(html dokumenty jsou textové soubory). V prostředí operačního systému Windows postačí notepad. 2. Znalost jazyka HTML- schopnost vytvořit zdrojový kód ve formátu HTML. 3. Prohlížeč pro kontrolu a zobrazení vytvořených WWW stránek(nejpoužívanější Microsoft Internet Explorer, Netscape Navigator, Opera, Mozilla). 4. Připojení k síti internet pro zpřístupnění WWW stránek ostatním uživatelům internetu.
Doporučení a zásady pro tvorbu WWW stránek kontrola zdrojového textu prohlížečem(lépe více prohlížečích), jelépechybyopravovat zapochodu,nežpodopsáníceléhodokumentu, jedna stránka by neměla obsahovat příliš souvislého textu bez nadpisu a obrázků, či jiných prvků pro členění textu, je lépe stránku nejprve připravit a pak na ni odkazovat, než vystavovat stránkysinformací,žeseteprvesenanípracuje, stránky by měly obsahovat informace o poslední aktualizaci(některé informace ztrácejí po delším čase smysl- například konání akce před dvěmi lety), pro jednoduchou správu stránek je lépe se vyhnout prvkům, kterým úplně nerozumíte.
Uložení WWW stránky Jak uložit vlastní WWW stránky? 1. Použijeme program winscp, kde na vyžádání zadáme přihlašovací jméno(login name) a heslo. 2. V případě, že adresář public html není na serveru vytvořen, vytvoříme jej jako nový adresář. 3. Zkopírujeme náš soubor(vytvořený WWW dokument) do tohoto adresáře a přejmenujeme jej na index.html. 4. Zkontrolujeme, zda stránka je v prohlížeči správně zobrazena uvedeme v něm patřičnou url adresu: http://homel.vsb.cz/~loginname.
Použití odkazů Odkazy, pomocí kterých jsou propojeny různé soubory, mohou být zapsány dvěmi odlišnými způsoby. Pomocí relativního odkazu a absolutního odkazu. Vlastní související stránky by měly používat relativní odkazy z důvodu přenositelnosti na jiný server. Odkazy na cizí zdroje a stránky by naopak měly být absolutní, aby byla zajištěna jejich funkčnost právě v případě jejich přenesení na jiný server. Tvar relativního odkazu se od absolutního liší neuvedením jména serveru stačí pouze jméno dokumentu, případně uvedení patřičného adresáře ze stromové struktury adresářů na disku, kde jsou dokumenty umístěny.
Například: Absolutní odkaz na dokument "http://www.cs.vsb.cz/durakova/vyuka/zpp/projekt.html" a odpovídající relativní odkaz "projekt.html" Pokudjesouborumístěnoúroveňvýš,stačídoodkazupřidatznakpro cestu na vyšší úroveň adresáře. "../projekt.html"
Syntaxe HTML elementy, tagy atributy znakové entity DTD, DOCTYPE Kontrola syntaxe Kontrola správné syntaxe HTML stránky pomocí specializovaných programů a služeb, nebojemožnépoužítsgmlparser. Validační služby on-line: W3C HTML Validation Service na adrese http://validator.w3.org/ Dr. Watson na adrese http://watson.addy.com/
Základní struktura HTML stránky Formátovací značky označovány také tag, zajistí textu určitý význam, který je interpretován použitým prohlížečem. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <meta http-equiv="content-type" content="text/html; charset=iso-8859-2"> <title>name_of_page</title> </head> <body> <H1>Nadpis první úrovně</h1> <P>První odstavec obsahuje...</p> <P>V druhém odstavci se popisuje...</p> </body> </html>
Vliv DTD na vzhled HTML stránky <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/tr/html4/loose.dtd"> <html> <head> <title>ukázka práce s DTD</title> <style type="text/css"> body { background-color: silver; } div { margin: auto 50px; width: 300px; border: 10px solid red; background-color: black; color: yellow; } </style> </head>
<body> <div>ukázka práce s DTD</div> </body> </html>
Definice HTML(XML) stránky <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "DTD/xhtml1-stri <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> <head> <title>moje první XHTML stránka</title> </head> <body> <p>tohle je jednoduchý XHTML stránka.</p> </body> </html>
Deklarace typu dokumentu Prostřednictvím deklarace!doctype se odvoláváme na DTD(Deklarace typu dokumentu) v dokumentech HTML(XML, XHTML). Tvar dodržuje ustálené pořadí s následujícím významem: <!DOCTYPE html za mezerou je značka dokumentu, malá písmena jsou vyžadována uxhtml PUBLIC veřejná deklarace typu dokumentu jako je HTML, XHTML, WML, NewsML, MathML "-//W3C//DTD HTML 4.01 Transitional//EN" jaký standard je použit, zde přechodový, jazyk angličtina.
Používání značek Tagy ve většině případů fungují jako závorky v matematice. použití levého(počátečního) tagu ve tvaru <xxx> vyvolá nutnost použít i pravý(koncový) tag </xxx>, v případě tzv. párového tagu. Nepárový levý tag se používá například při vkládání obrázků. Konkrétní význam elementu je dán použitým tagem identifikátor elementu. Text mezi počátečním a koncovým tagem daného typu tvoří tělo elementu. Identifikátory elementů mohou být psány malými i velkými písmeny. Zápisy ve tvaru <TITLE>, <TiTlE>, <title> i <title> prohlížeč chápe a interpretuje stejně. POZOR! Na začátku tagu nesmí být mezera! Například < title> je špatně! Tagy, které prohlížeč nezná, ignoruje. Nemusí hlásit žádnou chybu! VeWindows,znak < jemožnénapsat(bezpřepnutíklávesnicena anglickou)stiskemklávespravýalt + <,znak > stiskemklávespravý Alt + >.
Členění dokumentu HTML dokument HEAD První HTML stránka BODY H1 Nadpis první úrovně P Prvníodstavecobsahuje... P Druhýodstavecpopisuje.... P Posledníodstavec...
Editory 1. Strukturní editor přímá úprava výsledného kódu, nutná znalost jazyka HTML, užívají profesionální tvůrci dynamických a jinak specifických stránek, z důvodu kontroly nad vytvářeným kódem, text file Notepad, HomeSite, UltraEdit, české EasyPad a PSPad. 2. Wysiwyg editor zobrazuje při psaní přímo vzhled stránky v prohlížeči, automatické generování kódu,(kód při ukládání i trochu mění!!!) pohodlné zpracování, neukazují to, co pak prohlížeč opravdu zobrazí Microsoft FrontPage, Dreamweaver, Adobe GoLive, Mozilla Editor.
Přehled HTML značek(tagů) Struktura Text Bloky Seznamy Odkazy Obrázky Tabulky Rámy Objekty Formuláře
Hlavička Skripty a styly(kaskádové)
Proč XHTML Nástupce HTML využívá výhod XML a HTML. Přísná, ale jednoduchá pravidla vedou ke snadnému automatizovanému zpracování. Všechny aplikace XML mají stejný základ syntaktických pravidel. (Podpora univerzálních programů a knihoven funkcí pro každou novou aplikaci XML.) Vyšší srozumitelnost pro počítače by měla vést k lepšímu zpracování u vyhledávačů, katalogů stránek a dalších automatizovaných služeb. Připravenost na ukončení podpory HTML.
Rozdíly XHTML oproti HTML Striktně se vyžaduje: Všechny atributy mají hodnoty v uvozovkách Zákaz křížení tagů
Rozdíly XHTML oproti HTML Další rozdíly XHML oproti HTML: tagy a atributy jsou pouze malými písmeny Nepárové tagy končí lomítkem Párové tagy jsou párové povinně Všechny atributy musejí mít hodnotu Interní javascript a styly se zapisují jiným způsobem Dokument má mít XML prolog. Dokument požaduje správný doctype.
Působení stránek na čtenáře grafický design- první uživatelův dojem, ohled na široký okruh lidí struktura stránek, navigace na stránkách syntakticky správný HTML kód- méně práce pro prohlížeč vhodné metainformace- méně práce pro vyhledávací roboty Jednotlivé prvky je vhodné uvážlivě vyvážit, každý dle svého citu.
Obsah versus forma Ideál vyváženost obsahu a formy.(internet a HTML jazyk) původně byly určeny jako médium zprostředkující obsah. Formátování stránek- nese sebou chyby v zobrazování v prohlížečích různého typu, každý prohlížeč interpretuje jinak Rychlost natahování pomalé je způsobeno zejména mnoho obrázků text s mnoha definicemi fontů, velikostí a barev písma, Čitelnost písma volba- individuální patkové-písmocuriernenívhodné bezpatkové- Arial, Helvetica, Verdana pro dlouhé texty patková písma s rozdílnou tloušťkou tahů(takzvaný serif, například Times New Roman).
Pozadí font nezadávat- prohlížeč použije defaultní font zvýrazněnípříp.oživení-použitíobrázkučibarvynapozadíje nevhodné, velký obrázek se dlouho natahuje nečitelnépísmo-dbátnakontrastbarev Jednotný vzhled stránek autor určuje styl- měl by se dodržet jednotný styl pro všechny stránky jednotná úprava nenutí uživatele učit se na každé stránce jiné ovládání a rozmístění prvků rychlejší natažení(sdílené soubory s formátovacími prvky) rozlišuje daný web od ostatních stránek protvůrcejeisnažšípráce(jednouprovšechnystránky)
Nevhodné!!! Nadpisy z obrázků dlouho se natahují vyhledávací roboti nejsou schopni nadpis přečíst při příštím natahování stránek se opakuje pomalost(není-li obr uložen) Flashové prvky ne všichni uživatelé mají flash nemusí se zobrazit psychologické bariéry
Čeština/ cestina Diakritika na HTML stránkách. Každý znak(písmeno, číslice,...) je reprezentován jako číslo od 0 do 255(jeden bajt), angličtina používá 128 znaků, tzv. ASCII. Od 128 do 255 jsou vyhrazeny pro diakritizované znaky jiných jazyků (např.kódlatin-1-pročeštinupoužitelnéjenáaí). Kódování = přiřazení diakritizovaných znaků číslům od 128 do 255. Problém: mnoho různých kódování. ASCII češtinabezháčkůačárek,tj.hackyacarkyjsouodstraneny ISO-8859-2(ISO Latin 2) mezinárodní kódovací norma pro jazyky střední Evropy, standard na Unixu a na Linuxu, u Microsoftu označován Středoevropské jazyky (ISO) CP1250(Windows-1250)
základní kódování u firmy Microsoft, platforma Windows, označován Středoevropské jazyky, vzniklo z ISO-8859-2, chybí plná kompatibilita MAC(Macintosh) standard užívaný na počítačích Apple Macintosh CP852(PC Latin 2) původní český a slovenský DOS KEYBCS2(Kamenici) kód bratří Kamenických, textový režimu MS-DOS KOI8-CS(KOI-8 CS) kdysi standard pro státy střední a východní Evropy Unicode, UTF-8 užití pro všechny světové jazyky, mezinárodní kódování znaků založené na tabulce 256 používaných znaků
Rozdíly kódování- nejlépe zjistit v kódovacích tabulkách š,ž,ť,š,ž,ť
Jak docílit patřičný typ kódování? automatické meta nastavení <meta http-equiv="content-type" content="text/html; charset=iso-8859-2"> nebo: <meta http-equiv="content-type" content="text/html; charset=windows-1250"> vytvořit stránku několikrát, pokaždé v jiném kódování, čtenář si vybere kódování použít serverové programy na překódování(saczech nebo ModCzech) použít český kód,(nejčastěji windows-1250) psátbezhackuacarek(čilivascii),špatněčitelné
Problémy dnešního webu informační zahlcení nutnost lepšího vyhledávání nestandardní rozšíření HTML jednotlivými výrobci prohlížečů Řešení problému? XML- extensible Markup Language pomocí DTD můžeme vytvářet nové jazyky založené na XML vhodně zvolené elementy přidají dokumentu informační hodnotu a usnadní prohledávání Webu XML má striktnější syntaxi než HTML(neukončené tagy, ohraničení atributů uvozovkami apod.)? snazší implementace
Reference www.jakpsatweb.cz/ jm.vse.cz/html/hatmatilka/titul.html www.kit.vslib.cz/ satrapa/www/ www.kosek.cz/ www.builder.cz www.developer.sk www.interval.cz www.wdvl.com msdn.microsoft.com/ie/ developer.netscape.com