Search Engine Optimization



Podobné dokumenty
Obsah Úvodem Kapitola 1 Search Engine Marketing (SEM) a Search Engine Optimization (SEO) Kapitola 2 Základy SEO

Pro úspěšné zvýšení návštěvnosti a dosažení předních pozic ve vyhledávačích provedeme nejdříve jednoduchou "SEO ANALÝZU WEBOVÉ PREZENTACE.

CSS. SEO Search Engine Optimization (optimalizace pro vyhledávače)

Pro úspěšné zvýšení návštěvnosti a dosažení předních pozic ve vyhledávačích provedeme nejdříve jednoduchou "SEO ANALÝZU WEBOVÉ PREZENTACE.

Pro úspěšné zvýšení návštěvnosti a dosažení předních pozic ve vyhledávačích provedeme nejdříve jednoduchou "SEO ANALÝZU WEBOVÉ PREZENTACE.

SEO (optimalizace pro vyhledavače)

Internetové vyhledávače

JÁ DĚLÁM TO SEO DOBŘE,

Placená forma (adwords, sklik)

Manuál pro obsluhu Webových stránek

SEO Optimalizace pro vyhledávače


SEO OPTIMALIZACE PRO VYHLEDÁVAČE JEDNODUŠE

7. SEO Nástroje pro analýzu úspěšnosti. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. PORTÁL KUDY KAM. Manuál pro administrátory. Verze 1.

Mějte dobrý web. Oslovte více lidí. Generujte vyšší zisk!

10. SEO Obsah meta, konkrétní elementy v html kódu. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Základní informace o světových, českých a čínských vyhledávačích, seznámení s RSS technologií

Efektivní e-marketing v cestovním ruchu a jak na něj?

Číslo a název šablony III / 2 = Inovace a zkvalitnění výuky prostřednictvím ICT

SEO optimalizace Jiří Psota

Pro vnitřní potřeby KSČM vypracoval Aleš Kejval lekce 3: VYHLEDÁVAČ(E) je:

regalsistem.cz Analýza z hlediska SEO offpage webové prezentace

Manuál Redakční systém

C3 Vyhledávání na Internetu

vasedomena.cz SEO ANALÝZA WEBOVÝCH STRÁNEK (9. SRPNA 2017)

SEO ANALÝZA Ukázka na reálných nonymizovan a ých datech

Příloha: SEO analýza webové stránky

Individuální projekt z předmětu webových stránek 2012/ Anketa

Internetový prohlížeč-vyhledávání a ukládání dat z internetu do počítače

Maturitní otázka - optimalizace webových stránek

Jak vyhledávat. Vyhledávače KAPITOLA 3

WEBOVÉ STRÁNKY ŠKOLY A REDAKČNÍ SYSTÉM

HLEDEJCENY.mobi. Obsah. Mobilní verze e-shopu. Důvody instalace

konzultační hodiny: středa od 9:45-11:15 (předem napsat o konkrétním problému, který chcete konzultovat)

Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání

SEARCH ENGINE OPTIMIZATION

SEO v CeSYSu. CeSYS manuál pro uživatele

Analýza webových stránek andreaspctipps.de

6. SEO úvod do problematiky, terminologie, principy. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Produktový list. Firemní profily

Webová stránka. Matěj Klenka

Kontingenční tabulky v MS Excel 2010

Průměrná měsíční návštěvnost dosahuje přes 2 milióny unikátních uživatelů*.

Redakční systém Joomla. Prokop Zelený

Vyhledávání na Internetu

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Maturitní projekt do IVT Pavel Doleček

Navigace na webových stránkách

Produktový list. Firemní profily

Webová grafika, struktura webu a navigace, použitelnost a přístupnost

SEO Audit a další úpravy KONTAKT. Bc. Martin Dřímal info@seoskrz.cz Telefon:

Marketing a reklama. Zpracoval: Ing. Petr Hlubuček, květen 2013 REKLAMA A INTERNET. Reklama se postupně z velké míry přesouvá na internet.

Návrh stránek 4IZ228 tvorba webových stránek a aplikací

Z HISTORIE SPOLEČNOSTI

Leady & MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK

7. Enterprise Search Pokročilé funkce vyhledávání v rámci firemních datových zdrojů

Produktový list Zboží.cz. PPC reklama Internetová reklama placená za proklik

MODERNÍ WEB SNADNO A RYCHLE

Studie optimalizace pro internetové vyhledávání a její využití v projektu TopServis

Tvorba webu. Úvod a základní principy. Martin Urza

tipů, jak zlepšit PPC kampaně před Vánoci

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky

materiál č. šablony/č. sady/č. materiálu: Autor: Karel Dvořák Vzdělávací oblast předmět: Informatika Ročník, cílová skupina: 7.

Snadná úprava stránek, nemusím umět HTML, tvořím obsah téměř jako ve Wordu. Jak změnit obsah nástěnky: vpravo nahoře Nastavení zobrazených informací

PALSTAT s.r.o. systémy řízení jakosti PALSTAT CAQ verze Kontakty 08/ Obsah

Uživatelská příručka

NÁVOD NA OBSLUHU INTERNETOVÉ PREZENTACE. Ataxo Czech s.r.o.

Administrace webu Postup při práci

Modul Ankety verze 1.11 pro redakční systém Marwel 2.8 a 2.7

Optimalizace pro vyhledavače a přístupnost webu

Uživatelský manuál. Aplikace GraphViewer. Vytvořil: Viktor Dlouhý

ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA

Databázové aplikace pro internetové prostředí PHP úvod, základní princip, vkládání skriptu, komentáře, výpis na obrazovku

MBI - technologická realizace modelu

Zadání grafického designu Trh poptávek

PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP)

ÚVOD... 3 REGISTRACE... 4 PUBLIKOVÁNÍ... 5 PŘÍSPĚVEK... 6 KALENDÁŘ... 7 MANUÁLY... 8 VLOŽENÍ NOVÉHO PŘÍSPĚVKU... 9 EDITOR... 10

VYHLEDÁVÁNÍ V NOVÉM PROSTŘEDÍ MEDVIK : ZÁKLADNÍ HLEDÁNÍ. Adéla Jarolímková Národní lékařská knihovna, referát metodiky a vzdělávání

Využití informačních technologií v cestovním ruchu P1

================================================================================ =====


CzechAdvisor.cz. Návod pro členy AHR

Nástrojová lišta v editačním poli

Inovace bakalářského studijního oboru Aplikovaná chemie

Kurz pro studenty oboru Informační studia a knihovnictví 5. Informační architektura

Inovace výuky prostřednictvím šablon pro SŠ

HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT

HTML - Úvod. Zpracoval: Petr Lasák

aneb velice zjednodušené vysvětlení základních funkcí a možností systému Vypracoval: Tomáš Dluhoš tomas.d@centrum.cz

PŘÍRUČKA. Správa obsahu webové prezentace. Formátování textu

Kapitola 1 První kroky v tvorbě miniaplikací 11

WNC::WebNucleatCreator

Obsah ÚVODEM... 3 KAPITOLA 1 PROČ JEŠTĚ NEMÁTE SVÉHO NEJLEPŠÍHO OBCHODNÍKA?... 4 KAPITOLA 2 PLÁNUJEME OBCHODNÍ STRATEGII WEBU...

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Praha6.cz. Správa moderního portálu

Mobilní zpravodajská aplikace idnes. A7B39PDA - Principy tvorby mobilních aplikací

Transkript:

Bankovní institut vysoká škola Praha Katedra Informačních technologií a elektronického bankovnictví Search Engine Optimization Bakalářská práce Autor: Michal Panec DiS. Informační technologie, Manažer projektů IS Vedoucí práce: Ing. Martin Černý Písek Červen, 2010

Prohlášení: Prohlašuji, že jsem bakalářskou, resp. diplomovou práci zpracoval samostatně a s použitím uvedené literatury. V Hostíně, 10.6.2010 Michal Panec

Poděkování: Rád bych touto formou poděkoval panu Ing. Martinovi Černému za vedení, připomínky a konzultaci při tvorbě bakalářské práce. Michal Panec

Anotace Obsahem této bakalářské práce bude zaměření na problematiku SEO optimalizace. Jedná se o postup při vytváření a úpravě obsahu webové stránky. Cílem těchto optimalizací je jednoznačně dosažení lepších pozic při vyhledávání webových stránek s daným obsahem. Optimalizace webových stránek zvyšuje obrat dané firmy a zajišťuje stále více nových klientů, kteří přicházejí na webové stránky pomocí klíčových slov. Další nedílnou součástí SEO optimalizace je analyzování klíčových slov, které určí nejčastěji zadávané slova pro hledání. Dalším cílem této práce bude analyzování a vyhodnocování dosažených výsledků. SEO optimalizace je stálá kontrola nad webovým obsahem. Annotation The content of this work is focused on SEO problem. This is a method to create and edit Web page content. The aim of optimization is achievement of better positions in searching of web pages with a given content. Website Optimisation increases the turnover of the company and assumes more and more new clients, who comes to the Web sites through the use of keywords. Another integral part of SEO is keywords analyzing that determines the most awarded words for search. Another objective of this work is analyzing and evaluating the results. SEO is a constant control over the content of the Web.

Obsah Úvod... 7 1 Základy SEO... 8 1.1 Co je to SEO... 8 1.2 Rozdíl mezi katalogem a vyhledávačem... 8 1.2.1 Katalog... 8 1.2.2 Fulltextový vyhledávač... 10 1.3 Jak funguje Google... 11 1.3.1 Co je to index vyhledávače... 13 1.4 Známkování webových stránek vyhledávačem... 14 1.4.1 Pagerank... 14 1.4.2 S-rank... 14 1.4.3 Jyxo rank... 15 1.4.4 Alexa rank... 15 1.4.5 Zjištění ranku webových stránek... 15 2 Optimalizace stránek... 15 2.1 Validita... 16 2.2 On-Page faktory... 16 2.2.1 Klíčová slova (keywords)... 16 2.2.2 Hustota klíčových slov... 17 2.2.3 Titulek stránky... 17 2.2.4 Klíčová slova v URL adrese... 18 2.2.5 Nadpisy... 19 2.3 Off-Page faktory... 20 2.3.1 Zpětné odkazy... 21 2.3.2 Anchor text... 22 2.3.3 Site map... 24 5

3 Zakázané metody optimalizace... 26 3.1 Cloaking... 26 3.2 Doorway... 26 3.3 Deceptive redirect... 27 3.4 Hidden kontent... 27 3.5 Alt image tag spaming... 28 3.6 Stuffing... 29 3.7 Link farms... 29 3.8 Duplicitní obsah... 30 3.9 Kopírování a vykrádání cizích webů... 31 3.10 Falešné a konkurenční metaznačky... 31 3.11 Spam klíčovými slovy... 32 3.12 Komentářový a katalogový spam... 32 3.13 Reakce vyhledávačů na zakázané metody optimalizace... 34 3.13.1 Spam report... 34 3.13.2 Spam report formulář Google... 35 3.13.3 Spam report formulář Seznam... 36 4 Analyzování a vyhodnocení dosažených výsledků... 38 4.1 Analýzy chování návštěvníků a vyhledávačů... 38 4.2 Vlastní statistika na serveru... 39 4.3 Externí statistiky... 39 4.3.1 Navrcholu.cz... 40 4.3.2 Toplist... 40 4.3.3 Google Analytics... 41 4.4 Shrnutí analyzování a vyhodnocení dosažených výsledků... 45 Závěr... 46 Zdroje... 47 Přílohy... 51 6

Úvod Cílem této bakalářské práce je seznámení s moderní metodou optimalizace webových stránek pro vyhledávače. Celý název této metodiky úprav zní Search Engine Optimization. V praxi spíše uslyšíme zkrácený pojem SEO. Získávání nových klientů, zakázek a odběratelů je prováděno zejména přes internet. Z tohoto důvodu by se veškeré naše kroky měli ubírat právě správnou optimalizací webových stránek tak, aby se staly pro vyhledávače lákavými. Je mnoho pravd o tvorbě a psaní zdrojového kódu stránek, ale jediným správným ověřením bývají právě dobré pozice webové stránky ve výsledku vyhledávače. Jednotlivé kapitoly práce nás postupně seznámí od základů přes jednotlivé úpravy správné optimalizace webových stránek. V samostatné kapitole přiblížím i zakázané metody optimalizace, kterou chtějí někteří tvůrci předehnat konkurenční webové stránky. V závěru práce bych se rád zabýval následnou analýzou dosažených výsledků. Dobře optimalizovaný zdrojový kód webové prezentace je bez následného ověření zbytečný. Toto téma jsem si zvolil z důvodu tvorby webových stránek a také pro zlepšení svých dosavadních znalostí. Na začátku své tvorby jsem nedosahoval takových výsledků, ale postupem času jsem své znalosti více prohluboval. V jistých případech svých prvních internetových stránek jsem pozoroval obrovský nárůst návštěvnosti. Některé mnou vytvořené webové prezentace vedly k přeskočení placených pozic ve vyhledávačích. Každý tvůrce internetových stránek by měl vytvářet dobře vypadající a uživatelsky oblíbený webový obsah. Při své dlouholeté činnosti jsem nikdy neužil zakázaných praktik nebo jiných metod, jak rychle a jednoduše získat vysoké pozice svých stránek. Neustálé vytváření nových metod a doporučení při tvorbě internetových stránek, mě vede k neustálému sledování aktuálního dění v této oblasti. Obecně platí, že techniky používané před několika lety, jsou v současnosti upravené nebo zcela nevyužívané. Získat zkušenosti v této oblasti nebývá složité, ale při neustálém zdokonalování dříve nebo později ztrácíme pojem o dané problematice. 7

1 Základy SEO V této kapitole se budu snažit vysvětlit pojmy jako je SEO, index vyhledávače, hodnocení webových stránek (rank stránek). Dále objasním základní rozdíly mezi katalogem a fulltextovým vyhledávačem. Popíši ve stručnosti základní principy fungování vyhledávače Google. V neposlední řadě se zaměřím na vyhledávání aktuální hodnoty daného hodnocení stránky. Veškeré tyto pojmy jsou důležitým předpokladem pro pochopení následujících kapitol. 1.1 Co je to SEO SEO je zkratka anglického slova Search Engine Optimization, v překladu znamená optimalizace pro vyhledávače. Tato optimalizace se zabývá metodikou vytváření a upravování internetových stránek takovým způsobem, aby jejich forma a obsah dosáhly co možná nejlepších výsledků v internetových vyhledávačích. Cílem SEO optimalizace je dosáhnout ve výsledku vyhledávače pro webovou prezentaci co možná nejvyšší pozice, která odpovídá danému obsahu, a tím přivádí více nových návštěvníků. [1] 1.2 Rozdíl mezi katalogem a vyhledávačem Základním úkolem každé webové stránky je sdělování informace popř. prodávat výrobky, proto je důležité, aby naše stránky vyhledalo velké množství lidí (potencionálních zákazníků). Pokud při hledání daného obsahu neznáme přesnou URL adresu nazpaměť jediné, co nám zbývá, je hledání pomocí katalogu nebo využití vyhledávače k nalezení požadovaných informací. [2] Katalog shromažďuje odkazy na další webové stránky, které bývají setříděny do určitých kategorií, aby bylo možná snadnější orientace při hledání dané problematiky. Na rozdíl od katalogu vyhledávač hledá v celém obsahu daného webu. [2] 1.2.1 Katalog Katalogy jsou webovým místem, které shromažďují odkazy na jiné webové stránky a portály. V těchto katalozích jsou webové odkazy tříděný do jednotlivých sekcí. 8

Při hledání v katalogu můžeme procházet jednotlivými sekcemi nebo vyhledávat podle jednoduchých dotazů. Při přidávání záznamu provedeme registraci do příslušné vybrané sekce. Po následné kontrole správnosti vložených údajů, úpravu a doplnění provede správce katalogu vložení tohoto záznamu do katalogu. [2] Tabulka č.1 Nejznámější české katalogy Seznam Tiscali Centrum Atlas http://www.seznam.cz/ http://www.tiscali.cz/ http://www.centrum.cz/ http://atlas.centrum.cz/ Tabulka č.2 Nejznámější zahraniční katalogy DMOZ Yahoo http://www.dmoz.org/ http://www.yahoo.com/ Při vyhledávání v katalogu se porovnává hledané slovo s nadpisem odkazu, jeho popisem a u některých katalogů i s tvarem zadané URL adresy. Důležité je připomenout, že při řazení výsledků vyhledávání se nebere v potaz samotný obsah webu. [2] Pořadí v katalogu lze ovlivnit vhodným výběrem klíčových slov nadpisu záznamu, popisem stránky a optimalizací URL adresy. Hustota klíčových slov a správné použití v kontextu má také obrovský vliv. Veškeré záznamy vložené do katalogu kontrolují lidé a proto nemůžeme vložit posloupný výpis klíčových slov. Takto vybraná klíčová slova pro SEO optimalizaci použijme i pro záznam do katalogu. Zásadně nevyužívejme přídavná jména a různé superlativy v popisu webové stránky, které mají nulovou informační hodnotu a nejsou tak vhodná. Většina katalogů také neumí skloňovat klíčová slova. Z tohoto důvodu je možné vyhledat vždy jen přesně vložené klíčové slovo. V opačném případě uživatel nedostane žádný výsledek. Vlastní řazení proběhne podle klíče. Většina dnešních katalogů má tento klíč podobný. Na prvních pozicích se řadí placené odkazy a to v pořadí podle zaplacené částky. Na dalších pozicích se zařadí neplacené odkazy a to podle výše hodnocení z fulltextu. Český katalog Seznam řadí podle S-ranku, Centrum provádí řazení dle svého rankingu fulltextu Morfeo. [2] V neposlední řadě je dobré si uvědomit, že registrací odkazu do katalogu zřídíme zpětný odkaz. Tvorba zpětných odkazů je jedna z části SEO optimalizace. Takto vytvořený zpětný odkaz tvoří dobrý základ pro posílení pozice ve vyhledávači. [2] 9

1.2.2 Fulltextový vyhledávač Fulltextový vyhledávač má za úkol hledat a stahovat dokumenty (webové stránky, dokumenty textových editorů, PDF atd.), které zapisuje do své databáze. Těmto úkonům zápisu do databáze říkáme indexace. Na základě takto vytvořené databáze umožní návštěvníkům vyhledávat jednoduché i složité dotazy. Google je jeden z nejznámějších zahraničních fulltextových vyhledávačů. Seznam, Jyxo a Morfeo patří mezi české internetové fulltextové vyhledávače. Většina dnešních vyhledávačů prohledává celý obsah daného dokumentu, takovým vyhledávačům potom říkáme fulltextové. [3] Fulltextový vyhledávač tvoří dvě základní části. První část je tvořena robotem, který je také nazýván crawler, spider, bot nebo pavouk a druhá webovým rozhraním. Základní činností robota je prohledávání webových stránek, stahování souborů a jejich indexaci. Další možné rozdělení robota by bylo na getter, který pouze stahuje soubory a indexer, který má za úkol soubory zpracovat a uložit do databáze pro další potřeby vyhledávače. Činnost robota nelze řídit, ale je možné zakázat indexaci některých stránek pomocí definice v souboru robot.txt. Tento soubor se nachází v kořenovém adresáři internetové prezentace. Robot si pamatuje, kde byl a v jeho algoritmu je přesně naprogramováno, kdy se na danou navštívenou stránku vrátí. Vyhledávači je možné zaplatit za pravidelné indexace dané webové stránky. [3] Registrace webové stránky do vyhledávače většinou postrádá smysl. Každý robot je schopen si danou stránku najít sám. Provádět registraci bez odkazu na stránku nepomůže. Výjimku tvoří pouze české stránky, které mají jinou doménu než.cz (například.com nebo.org). Takové stránky vyhledávače Jyxo nebo Morfeo indexují automaticky na základě vložení do některého katalogu. Pokud stránka nebude vložena do katalogu, je možné ji zaregistrovat do vyhledávače přímo. [3] Při zadání hledaného výrazu na webové stránce vyhledávače se porovnává dotaz s databází. Řazení výsledků vyhledávání je u moderních vyhledávačů tvořeno kombinací četnosti výrazu a popularity webové stránky (ranking). Fulltextový vyhledávač Google využívá PageRank, zatímco český vyhledávač Seznam používá jiný algoritmus nazývaný S-Rank. Přesný algoritmus řazení znají pouze programátoři. [3] 10

1.3 Jak funguje Google Google se skládá ze serveru obsahujícího seznam URL adres, které v pravidelných intervalech rozesílá pavoukům. Stažené webové stránky jsou odeslány do skladového serveru nazývaného storeserver. Následně jsou stránky zkomprimovány a uloženy do depozitáře. Každé stránce je posléze přiřazeno unikátní identifikační číslo docid. O indexování se stará tzv. indexer, který bývá nepostradatelnou součástí vyhledávače. [4] Obrázek č.1 Cesta informace databázemi Google [4] Každý dokument je následně převeden do souboru slovních spojení zvaných hity. Tyto hity obsahují záznam o slovu, pozici v dokumentu, přibližnou velikost fontu a jeho řez (tučně, kapitálky, kurzíva). Indexer odešle tyto hity do tzv. barelů, kde jsou připraveny pro odeslání k uživatelům. Následně je každé slovo převedeno na další unikátní 11

identifikační číslo wordid. Indexer současně spolupracuje se sdíleným slovníkem. Po převedení slova na wordid se jeho výskyt zapíše do seznamu v barelech. [4] Indexer dále plní funkci extrakce odkazů z indexovaných stránek. Zaznamenává nejenom samotnou URL adresu v odkazu, ale také tzv. anchor text, tedy text, který obsahuje uvedený odkaz. Do procesu vstupuje další program URLresolver, který čte text v odkazu a následně převádí relativní odkazy na absolutní. Tyto odkazy řadí podle docid. Následně tyto odkazy páruje s již obsaženými stránkami zpracované v rejstříku. Z takto vytvořené databáze se následně čerpá při výpočtu PageRanku všech dokumentů. [4] Google uchovává index všech svých internetových dat na řadě oddělených serverů, které se nacházejí na různých místech světa. Takové servery nazýváme Google Data Center a jejich úkolem je uchovávat informace. Většina Data Center je tvořena obyčejnými PC, která využívají upravenou verzi operačního systému GNU/Linux. Následné dotazy jsou pak distribuovány do jednotlivých Data Center pomocí hlavního Google server. Při volbě Data Centra dochází k výběru podle aktuálního vytížení a rozhoduje i geografická poloha uživatele. Postupná aktualizace indexu je způsobena aktualizací serverů jeden po druhém. [4] Z důvodu postupné aktualizace každého serveru je možné pro daný web získat více různých indexů v různém čase. Proces je někdy nazýván jako Google Dance. Tyto pohyby indexování umožnily sledovat začátek procesu aktualizace a bylo možné současně odhadnout konečný index webu. V dnešní době již tento stav nenastává. Aktualizace se v současné době provádí průběžně. [4] V minulosti existovalo odhadem deset Data Center. Každé toto centrum mělo svůj název (např. http://www-ab.google.com, http://www-ex.google.com atd.). Začátkem ledna 2004 byla tato centra nahrazeny bezmála půl stovkou nových. V současnosti jsou tato Data Centra přístupná pomocí IP adresy. Při změně na webu můžeme obdržet přibližný odhad finálního ohodnocení klíčových slov vyhledávačem Google za pomoci kontroly jednotlivých Data Center, protože ty jsou aktualizovány mnohem dříve než hlavní server na google.com. [4] Oblíbenost Google docílila založení inzertního systému Google AdWords a Google AdSense. Google AdWords umožňuje po založení účtu u společnosti Google vkládat inzeráty, které se zobrazí při fulltextovém vyhledávání ve zvláštním sloupci. Zobrazení je podmíněno finančními prostředky na účtu. Vložení inzerátu nese i své zásady. Je omezeno na rozsah a jeho obsah je také limitován. K vloženému inzerátu je možné zvolit několik 12

klíčových slov, po jejichž zadání vyhledávač Google zobrazí právě daný inzerát. Každé kliknutí na inzerát je poté zpoplatněno. Cenu za každé kliknutí si zvolí každý uživatel sám, ale minimální částku vždy stanoví Google. Cena za kliknutí má poté vliv na pořadí zobrazení daného inzerátu. [5] 1.3.1 Co je to index vyhledávače Pojmem index vyhledávače rozumíme databázi všech slov vyskytujících se v prohledávaných webových stránkách, která má za úkol urychlení vyhledávání. V současnosti rozeznáváme dva typy indexů. [4] Invertovaný index je řazený abecední seznam všech termínů, které se vyskytují na webové stránce. Současné internetové vyhledávače využívají právě tento typ indexu. Invertovaný index vytvoří slovník tvořený ze všech slov v daném dokumentu nebo souboru dokumentů (stránek) a každému slovu přiřadí dokumenty, ve kterých se nachází. Také přiřadí jeho pozici v rámci dokumentu jak je patrné na následujícím obrázku. [4] Obrázek č.2 Výpis z indexu vyhledávače [4] Druhým typem indexu je příponový strom. Jak již název napovídá, vytváří stromovou strukturu na ukládání řetězců znaků nad danou abecedou. Tento typ je vhodnější pro práci s frázemi. Následně se s ním rychleji pracuje, ale hůře se udržuje a vytváří. [4] 13

1.4 Známkování webových stránek vyhledávačem Všeobecně slouží rank k ohodnocení webové prezentace. Každý fulltextový vyhledávač obsahuje několik takových ranků, ale propaguje vždy jen jeden hlavní a ostatní jsou skryté. Internetových vyhledávač Google hodnotí stránky dle svého hodnocení, které je nazýváno PageRank. Oblíbený český vyhledávač hodnotí své stránky dle svého S-Ranku. V současné době nemá rank stránky veliký vliv na řazení výsledků vyhledávače. Na řazení výsledků se podílí mnoho dalších faktorů, které jednotlivé vyhledávače neprozrazují. Všeobecně platí, že čím je vyšší rank, tím je webová prezentace kvalitnější. Ranky mají 3 základní funkce. V menší míře se podílejí na řazení výsledků vyhledávače. Dle hodnoty se řídí počet návštěv webové stránky vyhledávacím robotem, který je také označován jako tzv. crawler. Poslední funkcí je zobrazení určité odvozeniny ranku, která se zobrazuje následně uživatelům některého toolbaru (doplňující lišta do prohlížeče). [6] 1.4.1 Pagerank Pagerank je algoritmus sloužící k ohodnocení webových stránek. Tento algoritmus tvoří základní pilíř světového vyhledávače Google. Byl navržený Larry Pagem a Sergeyem Brinem. Čím vyšší je hodnota Pageranku, tím je webová stránka kvalitnější. Přičemž Pagerank nabývá hodnot od 0 do 10. K výpočtu hodnoty Pageranku se využívá složitý algoritmus, který využívá strukturu hypertextových odkazů jako vzájemné doporučování stránek. [7] 1.4.2 S-rank S-rank je ukazatelem dobře zpracované webové prezentace a zaměřuje se především na český internet. Vyhodnocuje webové prezentace pro český internetový vyhledávač Seznam. Budování S-ranku se vyplatí při působení webové stránky na českém internetu. Hodnocení se soustředí jak na počet odkazů vedoucích na naši internetovou prezentaci tak i na jejich kvalitu. Dále hodnotí kvalitu webových stránek, na které odkazujeme my, proto je nezbytné pravidelně kontrolovat tyto odkazy. Hodnota S-ranku se pohybuje od 0 do 100, a vzrůstá po 10. Čím vyšší je hodnota, tím lepší je webová prezentace. [6] 14

1.4.3 Jyxo rank Vyhledávač Jyxo využívá algoritmus Jyxorank. Jyxorank určuje, jak moc jsou stránky známé a oblíbené na internetu. Výpočet je prováděn z množství odkazů na daný web. Vyšší hodnotu Jyxoranku získá web, na který odkazuje mnoho lidí. Tento rank je využíván pro české prostředí internetu. Jyxorank nabývá hodnot od 0 do 220. [6] 1.4.4 Alexa rank Alexa je název internetového vyhledávače. Alexa rank hodnotí doménu na základě návštěvnosti jednotlivých stránek uživateli, kteří mají nainstalovaný Alexa toolbar. Velikosti ranku ovlivňuje počet uživatelů, kteří vstoupí na náš web. Toto hodnocení nabývá hodnot od 1 do 10 000 000. Čím vyšší je hodnota, tím je postavení stránek horší. [8] 1.4.5 Zjištění ranku webových stránek Dnešní internetový prostor nabízí hned několik nástrojů pro zjištění aktuální hodnoty daného ranku. Pro nalezení daného nástroje využijeme některého z vyhledávačů. Po zadání názvu daného ranku dostaneme výpis vyhovujících stránek. Mnohé nástroje nabídnou zjištění více ranků najednou. Při tvorbě vlastních internetových stránek vím, že velikost ranku má vysoký vliv na cenu za umístění odkazu na tomto dobře hodnoceném webu. 2 Optimalizace stránek V následující kapitole se budeme věnovat jednotlivým úpravám zdrojového kódu webové prezentace, tak aby byl pro vyhledávače žádanější. Zaměřím se na validitu zdrojového kódu, která bývá hlavním problémem. Objasním rozdíly mezi On-page a Off-page faktory. V následujících podkapitolách postupně projdeme jednotlivé faktory, které ovlivňují umístění ve výsledcích vyhledávání. Vybereme pouze ty, které mají největší podíl a je potřeba se zaměřit právě na ně. Vysvětlím i pojem mapa webu, který výrazně zjednodušuje orientaci na daných webových stránkách. 15

2.1 Validita Pojem validita se dá vysvětlit jako syntaktická správnost zdrojového kódu webové stránky podle daných pravidel a standardů. Validita je jedním z měřítek definující kvalitu internetové prezentace. Pokud je zdrojový kód stránky validní, její tvůrce dodržel definovaná pravidla a standardy. Validní webová stránka se nepotýká se špatným nebo jiným zobrazením, které tvůrce nezamýšlel. Běžného uživatele prohlížejícího webovou stránku nebude zajímat její zdrojový kód, ale bude se ohlížet na obsah a grafické zpracování dané stránky. Většina vyhledávačů se snaží spíše o hodnocení očima běžného člověka a dává přednost kvalitnímu obsahu. Proto je již na každém tvůrci zda dodrží všechny standardy pro psaní zdrojového kódu internetové prezentace. [9] Pokud si na veřejně přístupném validátoru (např. validačním nástroji konsorcia W3C) necháme ověřit zdrojový kód webové stránky, kterou vyhledávač zařadil na první pozici, zjistíme, že drtivá většina takto úspěšných stránek nemá validní kód. Kvalitní a dobře strukturovaný obsah je důležitější pro optimalizaci pro internetový vyhledávač. [9] 2.2 On-Page faktory Vše co na našich internetových stránkách dokážeme ovlivnit, nazýváme On-Page faktory. Mezi tyto faktory zařazujeme veškeré HTML značky a jejich uskupení ve zdrojovém kódu. Dále pak navigační prvky a všechny části webové stránky, které můžou ovlivnit výsledky ve fulltextových vyhledávačích. Tyto faktory by měl každý dobrý tvůrce využívat již při samotné tvorbě. [10] Základní chybou mnohých autorů a návodů popisující jak optimalizovat internetové stránky je pouze snaha se zaměřit se na validitu HTML kódu. Tento přístup však není dobrým základem úspěchu. Základním problémem On-page faktorů není pouze validní kód, ale problematika je mnohem složitější. Mezi nejdiskutovanější elementy On-page faktorů patří zdrojový kód webové prezentace, nadpisová struktura, description (popisový meta tag), keywords (klíčová slova) a správná tvorba titulků webové prezentace. [10] 2.2.1 Klíčová slova (keywords) Důležitou částí optimalizace jsou právě klíčová slova. Pokud daná webová stránka nebude obsahovat klíčové slovo, které zadáme do vyhledávače, pak se stránka neobjeví ve výpisu vyhledávače. Veškerá klíčová slova charakterizují konkrétní web. Takto vybraná 16

klíčová slova je dobré použít i pro inzerát, který vkládáme na inzertní webové servery. Při zadání vybraných slov dojde k zobrazení právě námi vloženého inzerátu ve výsledku vyhledávání. V opačném případě bude výsledek vyhledávání nulový. Klíčovým slovům se podřizují i texty na webu, nadpisy, odkazy. Vše musí být přirozené, naším hlavním cílem by měl být uživatel. [11] Veškerá klíčová slova je dobré si stanovit hned na začátku tvorby webové stránky. Než se pustíme do určování klíčových slov pomocí nejrůznějších nástrojů, je dobré provést průzkum prostředí spojené s tématikou webu. Nejlepším řešením je vytvoření jednoduchého dotazníku, který necháme vyplnit majitele budoucích stránek, zaměstnance, ale také zákazníky. Z těchto dotazníků dostaneme seznam klíčových slov. [11] Při vytváření webových stránek pro společnost prodávající několik výrobků, vedli mé kroky vždy k rozdělení do samostatných stránek. Raději jsem využil pět oddělených stránek pro každý výrobek, na kterých jsem mohl samostatně optimalizovat klíčová slova pro daný produkt. Vždy se mi vyplatilo toto řešení, než využití jedné stránky pro více výrobků. 2.2.2 Hustota klíčových slov Klíčová slova by se měla na stránkách objevovat v takové míře, aby nebudila dojem nečitelného nebo nesrozumitelného textu. Vždy se snažíme počet klíčových slov omezit na hranici, kdy zachováme dobrou čitelnost daného obsahu na webové stránce. Optimální hodnota výskytu není stanovena přesnou hranicí. Při tvorbě vlastních webových stránek se řídím pravidlem používat klíčová slova v rozumné míře. Veškeré snahy s použitím několikrát opakovaného klíčového slova v obsahu je negativně ohodnoceno a má velký dopad na výsledky vyhledávače. [12] 2.2.3 Titulek stránky Pokud provádíme optimalizaci pro vyhledávače, je dalším důležitým prvkem právě titulek stránky. Pokud naše webové stránky navštíví některý z robotů, první na co se zaměří, bude právě titulek, který je poté zobrazen při výsledku vyhledávání jako první. Správným vytvářením titulků webových stránek zlepšujeme své pozice v internetových vyhledávačích. [13] 17

V zásadě se při tvorbě titulku stránky musíme držet základních pravidel. Nezahrnujeme do titulku název firmy, ale využijeme prostor spíše pro klíčová slova, která uživatelům přiblíží danou internetovou prezentaci. [13] Délka titulku má také svá pravidla nebo spíše doporučení. Pokud se soustředíme na vyhledávač Google, který je schopný zobrazit 65 znaků a Seznam 67 znaků, bude optimální hodnota titulku 64 znaků. Tuto hodnotu doporučuje i asociace W3C. Zásadně neopakujme slova v titulku stránky, která jsou vyhledávači brána jako spam. Obecně platí, že každá stránka má mít svůj vlastní unikátní titulek. [13] Při vytváření optimalizace spousta internetových prezentací kopíruje konkurenci a tak je možné spatřit při výsledku vyhledávání naprosto stejné titulky webů. Je možné využít některé znaky, jako jsou např. závorky, tečky, šipky, které oživí podobné titulky. Ve většině případů takto upravený titulek zaujme daleko více, než odkaz na první pozici. V praxi se doporučuje vytvoření nového titulku ihned při tvorbě následující webové stránky, proto aby nedošlo k jeho zkopírování. [13] Při tvorbě vlastních webových stránek jsem se vždy snažil využít některého klíčového slova právě do titulku. Tento čas strávený nad správným výběrem titulku internetové prezentace se velice vyplatil. Internetová prezentace v krátké době vystoupala na první pozice při zadání klíčového slova, které jsem využil do titulku. 2.2.4 Klíčová slova v URL adrese Použití klíčových slov v URL adrese je velice důležité a to stejně jako v doméně. Při optimalizaci pro vyhledávače se setkáme s výrazem SEO friendy URL (SEF) nebo také cool URL. Ukázku dané SEF adresy vidíme na následujícím obrázku. [4] Obrázek č.3 Rozdíl mezi generovanou adresou URL a SEF URL [4] Každá jednotlivá stránka se chová na serveru jako pevný dokument. Proto takto vytvořené URL adresy jsou raději indexovány než dynamické adresy s mnoha otazníky, 18

lomítky a proměnnými. Tyto URL adresy se snáze zapamatují a lépe popisují konkrétní stránku. Běžný uživatel při pohledu na takový odkaz přesně ví, co na takové stránce může očekávat. Dynamický odkaz nám mnoho neřekne. [4] Dalším pravidlem bývá neměnnost URL. Pokud z nějakého důvodu potřebujeme adresu změnit, je lepší tento krok ošetřit na straně serveru přesměrováním s upozorněním v hlavičce dokumentu. Při příchodu vyhledávače na původní stránku dochází ke zjištění z přesměrování v hlavičce, že obsah stránky je trvale přesunut na jiné místo. Je Důležité vědět, že i přes odstranění některé adresy si je vyhledávač schopen stále tuto adresu pamatovat. [4] 2.2.5 Nadpisy Každý nadpis tvoří základ dobře strukturovaného dokumentu. Nadpisem bychom měli stručně charakterizovat následující text. Nadpis první úrovně tvoří element H1 a měl by se vyskytovat v dokumentu pouze jednou. Pokud však máme logické důvody k využití více nadpisů této úrovně, může být začleněn tento element vícekrát. Nadpisy nižších úrovní se označují H2 až H6. Správné využívání nadpisů je základem úspěchu. Nedoporučuje se přeskakovat z nadpisů druhé úrovně na první, ale postupovat vždy od první úrovně níže. [14] 19

Obrázek č.4 Ukázka struktury nadpisů Většina uživatelů má problémy se čtením dlouhého nestrukturovaného dokumentu, tvořeného několika stránkami nepřerušovaného textu. Použitím nadpisů ulehčujeme práci v orientaci v dokumentu. Takto strukturovaný text bude pro uživatele daleko příjemnější. Důležitá je patrná struktura dokumentu na první pohled. [14] I vyhledávače kladou velký důraz na dobře vytvořené nadpisy jednotlivých kapitol. V nadpisu by měla být obsažena hlavní myšlenka celého textu, aby daný uživatel zadáním klíčového slova našel právě daný text. V zásadě se vyvarujte používání obecných termínů typu kapitola 1. [14] 2.3 Off-Page faktory Vše co naši webovou stránku ovlivňuje, ale nenachází se na ni, nazýváme Off-Page faktory. Jedná se především o zpětné odkazy, které jsou směrovány na danou stránku. V zásadě se nejedná jen o odkazy směrované pouze na konkrétní stránku, ale i odkazy, které vedou z vlastní webové stránky. Jednoduše se jedná o součet všech odkazů, které se nacházejí na stránce a podle důležitosti v sobě vyjadřují ranking stránky. Mezi další Off-Page faktory řadíme anchor text, kterému se bude věnovat samostatná kapitola. V neposlední řadě nás bude zajímat také mapa webu (site map). [3] 20

2.3.1 Zpětné odkazy Tento pojem chápeme jako odkazy, které se nachází na jiných webových stránkách a jsou směrovány na naši webovou prezentaci. Zpětné odkazy můžeme zakoupit nebo vyměnit. Zakoupený zpětný odkaz je po zaplacení dané částky za zobrazení zveřejněn. Naproti tomu výměna funguje na principu vzájemné výměny odkazů. Za zobrazení zpětného odkazu se neplatí žádná finanční částka, ale je podmíněna výměnou odkazů obou stránek. Při nedodržení zobrazení odkazu většina webů stahuje odkaz ze svého prostoru. Další možností získání je přirozenou cestou, kdy z důvodu kvalitního webového obsahu se na nás ostatní uživatelé budou odkazovat sami. Existuje ještě mnoho cest jak získat kvalitní zpětný odkaz a to buď registrací do katalogů, účastí ve fórech, publikování na blogu, inzercí na vlastních satelitních webech. Při výběru máme tedy hned několik hledisek jak získat zpětný odkaz na své webové stránky. [4] Při veškerém budování zpětných odkazů záleží na kvalitě stránky, z níž je odkazováno. Pokud na naše stránky bude odkazovat dvacet webů s Pagerank 6/10 bude to lepší než třicet stránek s Pagerank 2/10. Čím vyšší je hodnocení stránky s naším odkazem, tím více vyhledávač vidí důležitost našich vlastních stránek. Nemusíme se obávat poklesu našeho hodnocení, pokud odkazujeme na stránky s nižším hodnocením. Vyhněme se pouze odkazům na stránky se špatným obsahem. Poté můžeme značně poškodit vlastní stránky. [4] V žádném případě však není na škodu mít odkazy z méně hodnocených stránek. Výpočet hodnotnosti a relevantnosti stránky je dán kombinací kvality a kvantity zpětných odkazů. Jedna z dobrých cest je vybudování sítě výměnných odkazů se svými obchodními partnery, spřátelenými weby a dodavateli v našem odvětví. Model prosíťování je opět účinnější otevřený než uzavřený. Na internetu stále hledejme vhodná umístění pro odkaz na své webové stránky. Čím více stránek bude obsahovat odkaz na váš web, tím budou výsledky lepší. Postupem času se může z méně hodnocené stránky stát lépe hodnocená a náš odkaz náhle stoupne na ceně. [4] Vždy při odkazování na svůj web mějme na paměti, že neodkazujeme pouze názvem vašich stránek, ale snažme se začlenit i klíčová slova. Text obsažený ve viditelné části hypertextového odkazu má zásadní vliv na vnímání stránky, na které odkazuje. Tento text je označován jako anchor text, kterému bude věnována následující kapitola. Vyhledávač Google postupně přesouvá svůj důraz spíše na autoritu domény a počtu citací, nicméně správným zapsáním tohoto textu napovíme vyhledávači mnohé o dané stránce. [4] 21

Ukázka nevhodně zapsaného odkazu: Více o stolním tenise se dozvíte na následujícím odkazu <a href="http://www.ttckovarov.wz.cz/">zde</a>. Ukázka vhodně zapsaného odkazu: <a href="http://www.ttckovarov.wz.cz/">vše o stolním tenise</a>najdete právě na tomto místě. Ukázka nejlépe zapsaného odkazu: <a href="http://www.ttckovarov.wz.cz/">stolní tenis</a>nezisková organizace. Více o <a href="http://www.ttckovarov.wz.cz/zapasy.htm">termínech zápasů</a>zde. Při hledání umístění zpětných odkazů si vytipujte vhodné stránky. Pamatujme na to, že umístění se stává lepší na webových stránkách stejného zaměření. Algoritmus, který hodnotí příbuznost tematického zaměření, nazýváme Topic Rank. Na základě příbuznosti daných tematických zaměření se řadí posléze do tzv. clusterů. Pokud se naše webová stránka zařadí mezi podobné tematicky zaměřené stránky, je to jenom dobře. Primárně se snažme vyhledávat weby se stejnou tématikou, na místo naprosto odlišných. [4] Pokud budeme na Internetu propagovat jen hlavní stranu, nedosáhneme žádné vysoké návštěvnosti. Čím větší bude počet jednotlivých WWW stránek, tím více práce nás bude čekat. [4] Z mé vlastní zkušenosti s prodejem na Internetu vytvářím zpětné odkazy přímo na stránku s nově přidanými výrobky. Snažím se získat odkazy u firem, které daný produkt využívají nebo jej distribuují. Nevyužívám k nabídce nových výrobků hlavní stránku, kde většinou představuji danou webovou stránku. Z důvodu lepší propagace výrobků se mi vyplatí vytváření zpětných odkazů na jednotlivé stránky. 2.3.2 Anchor text Velké množství lidí (uživatelů) si ani nedokáže představit význam nebo pojem slova anchor text a přitom jsou s ním v každodenním kontaktu. Pod pojmem anchor text rozumíme viditelnou část hypertextového odkazu, která může značně vylepšit naše webové stránky. Většina fulltextových vyhledávačů velice ocení, pokud je tento odkaz tvořen klíčovými slovy. Na základě těchto klíčových slov, které jsou zahrnuty v odkazu je možné zjistit obsah dané webové prezentace. Po následné analýze odkazované stránky přidá zvýhodnění na slovní spojení, které tvoří již zmiňovaný anchor text. Odkazy jsou tvořeny 22

s ohledem na optimalizaci, ale pokud by to bylo spíše na škodu, nemusí být takto vytvořeny. S dobrou optimalizací klasických odkazů se setkáme na internetové encyklopedii, která se jmenuje Wikipedie. Každý článek, který na ni najdeme, obsahuje mnoho odkazů. Po bližším prozkoumání pozorujeme dobře zvolené anchor texty. Více ukazuje následující obrázek. [15] Obrázek č.5 Praktická ukázka odkazů v článku [15] Například vyhledávač Google kromě anchor textu porovnává okolí odkazu a také téma dané stránky. Z tohoto důvodu pro nás bude mnohem cennější, pokud odkazy budou směřovat na podobně zaměřené stránky. V jednoduchosti by se dalo říci, že odkazy vedoucí na dovolenou ve Španělsku, prodej mobilních telefonů, odkazy na stažení filmů a obchod s čluny nebude příliš dobré řešení. Daleko výhodnější jsou dobře zaměřené odkazy na stránce, než vytvoření dlouhého seznamu všeho možného. Vše má i své nevýhody, vytvoření takového výběru dá značně vyšší úsilí. Z hlediska PageRanku mají větší hodnotu stránky bez těchto naprosto nesmyslných odkazů na všechno možné. [3] Při porovnání zda je lepší textový nebo obrázkový odkaz, vychází daleko lépe využívat textový odkaz z důvodů, které budou uvedeny v následujícím odstavci. Už jen z praktického hlediska snadné úpravy textového odkazu, změny pomocí CSS (kaskádové styly) mohou dostat pěkný vzhled a v neposlední řadě jsou okamžitě stažené i na pomalém připojení. Na rozdíl od obrázkového odkazu, který je velice nepraktický. Z důvodu daleko větší velikosti bývá doba stažení mnohem delší a hodnota pro vyhledávač je nulová. Pokud i přes všechno musíme využít této možnosti, nezapomene na dvě nepostradatelné vlastnosti alt a title. V případě opomenutí těchto vlastností a vypnutí zobrazení obrázků ze strany uživatele, by se nic nezobrazilo. Této situace předejdeme právě vlastností alt, která se 23

zobrazí. Při najetí na daný obrázek vlastnost title zobrazí určitý textový popisek. Pokud porovnáme informační hodnotu pro vyhledávač, u obrázkového vidíme pouze dvě vlastnosti, nikoliv však co je na obrázku. Ve shrnutí nemají obrázkové odkazy takovou váhu jako anchor text. [3] 2.3.3 Site map V jednoduchosti bychom mohli Site map přirovnat k mapě webových stránek. Vytvořený soubor slouží k orientaci a informaci o jednotlivých stránkách webové prezentace. Site map umožní informovat vyhledávače o URL adresách, které se nacházejí na vašich webových stránkách. Zmiňovaný protokol již podporuje Google, Microsoft, Yahoo a pár měsíců i český vyhledávač Seznam. [16] Soubor sitemap.xml, který se nachází v kořenovém adresáři webové stránky, pomáhá indexovacím robotům v lepší indexaci obsahu. Pokud robot přijde na váš web a nalezne zmiňovaný soubor, máte mnohem větší šance indexace všech stránek. Prohlížečům sděluje důležitost vašich stránek a jejich aktualizaci. [16] Obrázek č.6 Ukázka souboru sitemap Pro praktickou ukázku přikládám stručný výpis takového sitemap.xml. který je zapsaný v kódování UTF-8. Tento soubor jsem vytvořil pomocí jednoduchého generátoru dostupného na Internetu. 24

<urlset> - Zapouzdřuje soubor a odkazuje na aktuální standard protokolu. <url> - Nadřazená značka pro každou zadanou adresu URL. <loc> - Adresa URL stránky musí být v absolutním tvaru, která je zakončena zpětným lomítkem. <lastmod> - Datum poslední změny souboru ve formátu W3C pro datum a čas. <changefreq> - Předpokládaná frekvence změn stránky. <priority> - Priorita dané adresy URL ve vztahu k ostatním URL adresám na vašem webu. Rozmezí platných hodnot je 0.0 až 1.0. [16] Při tvorbě souboru sitemap si jistě klademe otázku, zda ho vytvořit ručně nebo přenechat vytvoření online generátoru. Při malém rozsahu webových stránek doporučuji využití ručního vytvoření sitemap.xml. Pokud již webová prezentace disponuje stovkami stránek, které by při ručním vytváření mohly být špatně napsány, pak je lepší využít k tvorbě online generátor. Výhodu ruční tvorby máme rozhodně v určení priorit jednotlivým stránkám. Tuto možnost generátor nenabídne a přidělí všem stejnou prioritu. Ve většině případů doba vytvoření sitemap souboru je závislá na rozsáhlosti webové stránky. Existují i jednoúčelové aplikace, které po vložení adresy webové prezentace vytvoří tento soubor. Jako příklad uvedu aplikaci s názvem WonderWebWare SiteMap Generator, která je freeware. Při vytvoření souboru jakýmkoliv způsobem je pak vhodné použít následnou kontrolu. [16] Site map je z principu určený pro roboty, ale může být využitý i pro běžné návštěvníky. Pomocí jednoúčelových programů lze vytvořit z tohoto souboru schéma. Stejně jako soubor pro zakázání přístupu robota do určitých míst i tento soubor hledá robot v kořenovém adresáři webové prezentace. [16] 25

3 Zakázané metody optimalizace Tato kapitola se bude věnovat zakázaným metodám optimalizace webových stránek. Je dobré se seznámit s metodami, kterých bychom se měli při tvorbě vyvarovat. Obsahem práce není vysvětlení jak obejít nebo jiným způsobem vylepšit skóre webových stránek. Podle aktuálních informací vznikají stále nové a další důmyslnější metody, proto zde vysvětlené zakázané metody optimalizace nejsou v žádném případě všechny. Objasním také postavení vyhledávačů k těmto metodám používaných při tvorbě webových stránek. 3.1 Cloaking Metodu Cloaking bychom mohli volně přeložit jako podstrkávání, která označuje podvodnou techniku optimalizace pro vyhledávače. Stručně řečeno jde o způsob, kdy se snažíme podstrčit vyhledávacímu robotovi jiný obsah, než skutečnému návštěvníkovi webových stránek. [17] Vyhledávací roboti posuzují kvalitu webové stránky podle zdrojového kódu a obsahu (tzv. On-Page faktory). Metoda Cloaking je založena na podstrčení upravené webové stránky na míru algoritmu vyhledávajícího robota. Webová stránka je potom vyhodnocena robotem jako kvalitní a následně je díky tomu posunuta ve vyhledávání výše. Běžnému návštěvníkovi se zobrazuje obyčejná stránka. Rozlišení přístupu od běžného uživatele a vyhledávajícího robota se děje na základě IP adresy. Při zjištění přístupu vyhledávajícího robota dojde k podstrčení upravené stránky za pomoci serverového skriptu. [17] V dnešní době již tento způsob podvodu příliš nefunguje. Převážná většina vyhledávačů za použití této metody navíc penalizačně trestá. Cílem snažení vyhledávačů je tvorba ochrany jako obrana proti umělé manipulaci s výsledky vyhledávání. K odhalování slouží i konkurence, která přes spam report (viz. kapitola 3.13.1) nahlašuje podezřelé stránky. [17] 3.2 Doorway Další metoda zakázané optimalizace se nazývá Doorway a je založená na manipulaci s vyhledávači. Slouží k ovlivnění výsledků, jak bude webová stránka 26

hodnocena. V překladu by se tento druh metody nazýval jako podvodné vstupní stránky. Úvodní stránka je vytvořena tak, aby získala vysoké hodnocení robotem. Takto upravená úvodní stránka by běžnému uživateli nepřinesla žádný užitek. Z tohoto důvodu je opět pomocí serverového skriptu přesměrován na další, která se již stává pro uživatele zajímavou. V principu je tato metoda velice podobná předchozí zvané Cloaking. [18] 3.3 Deceptive redirect Metoda Deceptive redirect je další podvodnou optimalizací webové stránky a její český název zní klamavé přesměrování. Zjednodušeně řečeno uživatele přesměruje na jiné cílené místo. Uživatel při prohlížení webové stránky klikne na odkaz, který si vybral právě podle popisu daného odkazu. Z tohoto popisu se domnívá, že obsah ukrývající odkaz bude pro něho relevantní. Při zobrazení však dostává naprosto jiný druh obsahu, než obsahoval daný popis. V tomto případě došlo k přesměrování na naprosto odlišné místo. Podvodné klamavé přesměrování se také využívá při konkurenčním boji na internetu. Uživatel je přesměrován na výrobek konkurence při prokliku na konkrétní výrobek. [19] 3.4 Hidden content Metoda Hidden content je založena na skrývání textu nebo odkazů. Takový způsob je opět brán jako pokus o podvodný způsob získání lepších výsledků. Toto chování je vyhodnoceno jako nedůvěryhodné ze strany vyhledávačů. Z logického hlediska je samozřejmé, že zobrazování jiných informací pro vyhledávače a jiné pro běžného návštěvníka webových stránek je nepřípustné. [4] Veškerý text na webové stránce, který nevidí běžný uživatel, je brán jako skrytý. Ne rozlišuje se jakým způsobem je daný text zamaskován. Mezi nejčastější metody jak schovat text nebo nadbytečná klíčová slova patří využití barvy stejné s pozadím, umístění textu pod obrázek, skrytí textu pomocí kaskádových stylů a nastavení velikosti písma na nulovou hodnotu. [4] Jsou různé důvody, proč tvůrci webových stránek využívají Hidden content. Mezi důvody patří nesmyslné napsání textu od zákazníka, který trvá na dané stylizaci obsahu a není tedy možné zakomponovat důležitá klíčová slova. Vzhledové působení webu je možné také narušit použitím klíčových slov, které výrazně změní vzhled dané webové 27

stránky. Takový problém správce webových stránek vyřeší skrytím potřebných klíčových slov před zraky klienta a budoucích návštěvníků. [4] Při použití atributu H1 (nadpisový tag) na název dané stránky dochází k výraznému posílení důležitosti. Takto vytvořený text je následně schován pomocí kaskádových stylů a na místo textu se návštěvníkovi zobrazí grafické logo. Při hlubším prozkoumání tohoto řešení by se mohlo mluvit o neškodné záležitosti. Ovšem ze strany vyhledávače by se mohlo jednat o využívání skrytého textu v obsahu stránek. Při tomto zjištění by taková stránka mohla být penalizována. Z tohoto důvodu využití stylově vytvořeného grafického loga firmy nebývá dobrým řešením. Pokud i přes všechna varování chceme využít takto skrytý text, pomocí kaskádových stylů, je nezbytné, aby daný text odpovídal tomu, co je na obrázku. V opačném případě špatného nebo naprosto odlišného popisu obrázku se opět bude jednat o nepovolenou praktiku. V neposlední řadě je možné také využití značky alt, která je právě k popisu obrázku určena. [4] Obdobné řešení se využívá při skrývání odkazů. Pod výrazem skrytý odkaz si představme odkaz, který je před zraky uživatelů schován a vyžívá se pouze pro procházení robotů. Pro toto schování využijeme skrytý text, zmenšení pomocí kaskádových stylů na velikost jednoho pixelu nebo schováním do malé pomlčky nebo tečky. [4] Z vlastní tvorby webových stránek jsem nebyl do současné doby nucený použít metodu Hidden content pro získání lepších výsledků, protože využívám optimálního rozložení klíčových slov do textu a z tohoto důvodu dosahuji stejných výsledků. 3.5 Alt image tag spaming Metodou Alt image tag spaming (zaspamování popisů obrázků) se tvůrci snaží nashromáždit do svých internetových stránek co nejvíce klíčových slov, které se jinak v celém obsahu nevyskytují. Při vložení klíčových slov pomocí popisů nebo spíše alternativních textů v parametru alt docílí zlepšení počtu klíčových slov, které by v případě vložení do obsahu naprosto znehodnotily webovou stránku. Vyhledávač Google přikládá velkou váhu na parametr alt. Pro nalezení obrázku vyhledávačem je brán za základ popis a text nacházející se okolo obrázku. Zaspamování popisů u obrázku získáme jednoznačně lepší pozice při řazení výsledků. [20] Skutečným účelem parametru alt je zobrazení alternativního textu při nezobrazení nebo zákazu zobrazení obrázku ze strany uživatele. Nikoliv však k získání lepších pozic při řazení výsledků. Parametr alt je dobré využívat, ale neměl by sloužit k nashromáždění 28

velkého množství klíčových slov. Při popisu obrázku využijeme krátkého výstižného popisu konkrétního obrázku. [20] 3.6 Stuffing Metoda, která je založena na často se opakujících a matoucích slovech a je nazývána Stuffing. Tato slova jsou nesmyslně opakovaná například v předchozí metodě zaspamování parametru alt. Bez přesného důvodu jsou často zařazována do souvislého textu a budí dojem něčeho nadbytečného. Běžný text je uměle doplněn o klíčová slova a vypadá následujícím způsobem. [21] Příklad využití metody Stuffing: Náš hotel nabídne příjemné prožití prázdnin (levné ubytování, Internet, bazén, tenisové kurty, mp3, stahování filmů, dovolená, sport). Příklad je značně nadnesený, ale při bližším pohledu na dnešní internetové stránky je možné takto nesmyslný text najít. K těmto praktikám tvůrce nevede ani tak nízká znalost českého jazyka jako spíše touha vměstnat zajímavá klíčová slova do obsahu. Rozumnější a zkušenější tvůrci vyhledávají lepší možnosti začlenění zajímavých slov do textu. [21] Stuffing se nevyskytuje jen v běžném textu, ale můžeme ho najít v meta značkách webových prezentací typu keywords, description nebo title. Použití několikanásobné zkopírování slova ve značce title, nemá naprosto žádný význam. Ve výsledku budou mít slova naprosto stejný význam, jako osamocené slovo. Lepších výsledků tak nedosáhneme, naopak obrovské množství slov bude odměněno penalizací. Naprosto stejného výsledku dosáhneme při zaspamování meta značek. [21] 3.7 Link farms Patičkové farmy jsou označeny anglickým výrazem Link farms a obsahují nepřeberné množství externích odkazů. Jedná se o několik set nebo i tisíců stránek vzájemně provázaných odkazy. Po příchodu vyhledávače na stránky dochází k zaindexování, a protože je obsaženo obrovské množství vzájemných zpětných odkazů, přiřadí vysoké hodnocení. Tyto jednotlivé stránky nepřinášejí žádnou informační hodnotu a pro uživatele nemají žádný význam. Přesto se objevují ve výsledcích vyhledávání. Často 29

takové stránky vznikají na subdoménách, které při penalizaci zrušíme a přestěhujeme celou farmu odkazů na jiné místo. Veškeré toto snažení zvyšuje ranking daných stránek. [22] Jediné nebezpečí hrozí v případě odkazování na tyto špatné stránky. V opačném případě nedojde k žádnému negativnímu projevu, pokud link farma odkazuje na naše stránky. Toto má své praktické odůvodnění. Podobně by šlo bez přičinění zlikvidovat konkurenční stránky pouhým umístěním odkazu na některou z takových farem. Zápatí s více jak dvaceti nerelevantními externími odkazy považujeme za Link farmu. Dnešní vyhledávače se snaží postihovat weby s více jak šedesáti externími odkazy. [22] 3.8 Duplicitní obsah Duplicitní obsah vzniká tehdy, pokud větší množství různých adres URL směřuje na totožnou webovou stránku nebo na stránky s podobným obsahem. Nejčastějším typem duplicitního obsahu jsou stejné webové stránky, na které je možné odkazovat např. čtyřmi různými adresami. [23] http://plastiko.cz/ http://plastiko.cz/index.htm http://www.plastiko.cz/ http://www.plastiko.cz/index.htm Většina vyhledávačů nabízí ve výsledcích vyhledávání kvalitní webové stránky, které se neopakují nebo si nejsou velice podobné. Z tohoto důvodu jsou vyhledávače velice citlivé na duplicitní obsah stránek. Z uvedeného příkladu si vyhledávač vybere vždy jen jednu verzi a ostatní nezobrazuje při výsledku vyhledávání. V některých případech naprosto ignoruje zpětné odkazy na ostatní varianty URL a daná webová stránka ztrácí hodnocení, které určuje její pozici. [23] K duplicitnímu obsahu může dojít velice jednoduše. Při zadání adresy na webovou stránku využíváme www, ale v některých případech zadáme adresu bez www. Používáme tak 2 různé adresy vedoucí, ale ke stejnému obsahu. Pokud využíváme více domén, které směřují ke stejnému zdroji, je lepší využít přesměrování na straně serveru hlavičkou 301 nebo 302 na jedinou zvolenou adresu. Drtivá většina vyhledávačů tento krok respektuje a pochopí tak, že hodnocení jednotlivých stránek domén sčítá. [23] 30

Osobní tvorba webových stránek mě několikrát přivedla na přesměrování pomocí meta značky typu refresh přímo ve zdrojovém kódu konkrétní stránky. Přesměrování jsem využíval hlavně z důvodu nemožnosti konfigurace webového serveru. Při nastavení vlastního webového serveru bych raději volil přesměrování pomocí hlavičky 301. <meta http-equiv="refresh" content="10;url=http://www. lhota-mlckovsky.eu/"> Na tomto konkrétním zápisu ukazuji přesměrování z jedné domény na druhou. Hodnota 10 určuje dobu, po které dojde přesměrování. Po uplynutí doby dochází k přechodu na udanou URL adresu. 3.9 Kopírování a vykrádání cizích webů Obecně se vyhledávače k takovému vykrádání webových stránek staví velice negativně. Zejména český vyhledávač Seznam. Jako příklad je možné uvést naprosto nový web, který neobsahuje žádné texty a pouze využije kopií dat stažených z jiné webové stránky (bez souhlasu vlastníka původních webových stránek). Při tomto zjištění, kdy vyhledávač Seznam kontaktuje danou stránku a ověří si odcizení textů, dojde k tomu, že zařadí kopírovanou webovou stránku na černou listinu. Ke zjištění může docházet v zásadě dvěma způsoby. Jednak si tohoto zneužití všimnou sami administrátoři vyhledávačů nebo se konkrétní majitel ukradených textů přihlásí sám. Jeho povinností je doložení autorství. Vyhledávače využívají jednoduché nástroje, které porovnávají stáří shodných textů, vyberou vždy ten starší. [21] 3.10 Falešné a konkurenční metaznačky Typickým příkladem špatného využití SEO technik je zneužití meta značek. I v tomto případě se využívá spojení, které naprosto nezapadá nebo nesouvisí s obsahem webové stránky. Využívají se slova, která jsou často vyhledávaná. Taková klíčová slova se používají k lákání návštěvníka na webové stránky. [24] Při zneužití této techniky je návštěvník, který zadá klíčové slovo hledaného produktu naveden naprosto do jiných míst. Obvykle i na stránky konkurence, které však nemá s daným produktem nic společného. Konkurence takto může využívat značky 31