ZDROJE INFORMACE A JEJÍ MĚŘENÍ

Transkript

1 ZDROJE INFORMACE A JEJÍ MĚŘENÍ Prof. RNDr. Milan Mareš, DrSc. Jihočeská univerzita České Budějovice, Přírodovědecká fakulta České Budějovice

2 Název: Zdroje informací a jejich měření Autor: Milan Mareš Editoři: Jiří Ivánek a Radim Jiroušek Vydal: Ústav aplikované informatiky, Přírodovědecká fakulta Jihočeské univerzity v Českých Budějovicích Rok a měsíc vydání: listopad 2018 Formát: PDF Vydání: první Forma: elektronická, CD Náklad CD: 50 ks on-line adresa: ISBN M. Mareš publikaci, nebo její části, je možné volně šířit v případě, že je jasně uveden její autor

3

4 O autorovi Prof. RNDr. Milan Mareš, DrSc. ( ) se narodil v Českých Budějovicích, kde také navštěvoval základní a střední školu. Svá vysokoškolská studia v oboru Teorie pravděpodobnosti a matematická statistika na Matematicko-fyzikální fakultě Univerzity Karlovy v Praze absolvoval v roce Od roku 1966 pracoval nepřetržitě v Ústavu teorie informace a automatizace Československé akademie věd a dosáhl zde vědeckých hodností kandidát věd (1977) a doktor věd (1990) se specializací Teorie her. Na Univerzitě Karlově byl pak jmenován v roce 1997 docentem na základě habilitační práce Výpočty s vágními čísly a v roce 2001 profesorem v oboru Teoretická informatika. V Ústavu teorie informace a automatizace Akademie věd působil ve vedoucích funkcích místoředitele pro vědu ( ) a ředitele ( ). Od roku 2005 do své náhlé smrti zde též řídil projekt Výzkumného centra Data algoritmy rozhodování, do něhož byly kromě ústavu zapojeny i tři vysoké školy a pět firem z praxe. Od roku 2008 až do své smrti garantoval studijní program Aplikovaná informatika na Přírodovědecké fakultě Jihočeské univerzity v Českých Budějovicích, kde vedl přednášku teorie informace, ke které sepsal tato skripta. Prof. Milan Mareš byl vynikajícím badatelem v několika oblastech výzkumu. Jeho monografie Výpočty s fuzzy veličinami (Computation over Fuzzy Quantities, CRC-Press 1994) byla hojně citována předními světovými odborníky v teorii fuzzy množin a systémů. Propojení jeho výzkumu v různých směrech se odrazilo v další monografii Fuzzy kooperativní hry: kooperativní chování s vágními očekáváními (Fuzzy Cooperation Games: Cooperative Behavior with Vague Expectations, Physica Verlag 2001). Jeho bibliografie obsahuje stovky vědeckých článků, příspěvků na mezinárodních konferencích a kapitol v knihách. Byl též dlouhodobým šéfredaktorem časopisu Kybernetika. Prof. Milan Mareš byl také skvělým popularizátorem vědy. Širokou čtenářskou obec potěšily mnohé články k zajímavým tématům z matematiky a informatiky v novinách a časopisech, zvláště pak mimořádně čtivé a přitom fundované knihy Slova, která se hodí, aneb jak si povídat o matematice, kybernetice a informatice (2006) a Příběhy matematiky (2008). Jiří Ivánek a Radim Jiroušek Poděkování Velice bych chtěl poděkovat panu profesoru Jiřímu Ivánkovi a panu profesoru Radimu Jirouškovi, kteří se ujali této publikace po smrti pana profesora Milana Mareše a kteří publikaci připravili k vydání. Libor Dostálek - 4 -

5 Předmluva Hlavním účelem předmluvy v učebnicích bývá umožnit čtenáři hledat odpověď na dvě otázky. Jestli právě on je ten, pro koho byl učební text napsán, a jestli text, který drží v ruce, je právě to, co on hledá. Nuže, v našem případě se věci mají takto. Skripta, která jste otevřeli, se obracejí na čtenáře, který má celkem dobrou schopnost číst text s výskytem matematických vzorečků na úrovni úvodních vysokoškolských kursů o základech lineární algebry a počtu pravděpodobnosti (a tím i té nejelementárnější statistiky). Mnohem důležitější je ochota vnímat strukturu obecných matematických modelů reálného světa a používat, je-li to nezbytně nutné, také intelekt. Není nutné, aby byl čtenář přímo matematik v tom smyslu, že text nerespektuje formální logickou strukturu matematických učebnic (to znamená výklad ve stylu Definice, Věta, Důkaz) ani neuvádí důkazy předkládaných tvrzení ve striktně formálním stylu. Na druhé straně následující kapitoly obsahují výklad základních pojmů teorie informace a disciplín, které s informacemi nebo znalostmi přímo souvisejí. Protože je teorie informace výrazně matematická (či teoreticky kybernetická) disciplína, jsou její pojmy a výsledky formulovány matematickým jazykem. Následující text na tom mnoho nemění, doprovází ale řeč vzorců heuristickým (pro méně trénované slovním a přibližným) komentářem a místo matematických důkazů je dána přednost spíše vysvětlení, proč je právě uvedené tvrzení užitečné, a co z něj pro ty, kteří se zabývají informacemi, vlastně plyne. Čtenář, který si přeje jít ve svém studiu hlouběji, je v závěrečném seznamu doporučené četby odkázán na matematicky rigoróznější zdroje. Text skript je rozdělen na tři nestejně dlouhé části. První shrnuje pojmy a znalosti, které přímo nespadají do přihrádky teorie informace a čtenář už na ně nejspíš někde narazil, nicméně se budou hodit a nemusely mu příliš utkvět v paměti. Druhá část je zamýšlena hlavně pro studenty bakalářského stupně studia, zejména tím, že teoretické partie doplňuje příklady a také v některých případech uživatelskými komentáři vhodnými pro poučení o potenciálních problémech, které s informací souvisejí. Třetí část, kterou by neměli přeskočit studenti magisterského stupně, je o trochu více matematicky formulovaná, obsahuje pojmy a teoretické výsledky, které rozšiřují a doplňují text předchozí části, a celkově rozšiřují obzor toho, kdo chce mít o teorii informace a jejím smyslu solidní představu. Nicméně i pro ni platí to, co bylo o něco výše napsáno o nárocích na matematickou průpravu případných čtenářů. Samozřejmě, ani student bakalářského stupně se nemusí obávat zdravotních rizik po nahlédnutí do třetí části. Na závěr má potenciální čtenář právo na jedno varování. To, že skripta nenesou v názvu termín teorie informace, není náhoda. Na jednu stranu, samozřejmě, nezahrnují teorii informace v její celé šíři to ani nejde. Na druhé straně ale obsahují některé partie teoretické kybernetiky a teoretické informatiky, které se do teorie informace obvykle nezařazují, pojmy jako informace nebo znalost pro ně ale mají značný význam a kde jinde se o nich má čtenář něco dozvědět?. Jestli je to nedostatek nebo výhoda, to bych raději nechal na čtenářích. Autor - 5 -

6

7 Obsah PŘEDMNLUVA...5 OBSAH...7 ČÁST I: NÁSTROJE Kybernetika a informatika a jak je vnímat Intuitivní teorie množin Logické operace a symboly A Výrokový počet B Tautologie C Kvantifikátory Elementární počet pravděpodobnosti A Základní definice B Podmíněná pravděpodobnost C Náhodné procesy D Náhodná a pseudonáhodná čísla Modulární algebry...20 ČÁST II: INFORMACE A JEJÍ ZDROJ Co je informace? Zdroj informace A Nositelé informace - data A.1 Abecedy A.2 Kódy A.3 Morseova abeceda A.4 Číselné soustavy B Zdroj informace B.1 Formální model zdroje B.2 Simulace zdrojů informace...50 ČÁST III: MĚŘENÍ INFORMACE GENEROVANÉ ZDROJEM Informace nesená jednotlivými znaky A Informace obsažená ve znacích B Čemu se říká mluvnice Rozhodování a jeho závislost na informaci A Preference - relace uspořádání na množině možností B Poznámka o užitku B.1 Nahrazení kvalitativní relace uspořádání kvantitativní stupnicí B.2 Vztah nominálních hodnot výsledku a jejich užitků C Základní model D Rozhodování za jistoty E Rozhodování za rizika F Rozhodování za nejistoty G Stručná poznámka k typům rozhodování Entropie zdroje informace A Co je informační entropie B Sdružená a podmíněná entropie C Vlastnosti informační entropie D Entropie přirozených zdrojů informace D.1 Ještě jednou o malých zelených mužíčcích D.2 Entropie přirozených jazyků D.3 Mluvnice a podmíněné entropie D.4 Entropie signálů...72 ZÁVĚREČNÁ POZNÁMKA...74 DOPORUČENÁ LITERATURA

8 Část I: Nástroje Už v Předmluvě se vyskytuje varování, že se v první kapitole vyskytnou některé partie matematiky, které se v teorii informace využívají a které se v následujících kapitolách skript vyskytnou. Jedná se o stručnou úvahu nad obsahem termínů kybernetika a informatika, jednoduché základy intuitivní teorie množin, hlavní pojmy matematické logiky a základy elementárního počtu pravděpodobnosti a kombinatoriky, která se v nich uplatňuje. Nezapomínejme, že všechny části této kapitoly slouží tomu, aby připravily terén pro výklad pojmů a metod teorie informace a rozhodně si nekladou za cíl, podat vyčerpávající výklad příslušné oblasti matematiky. Terminologická poznámka. Nejen v této kapitole, ale v celých skriptech budeme pro různé typy čísel užívat obvyklé a v matematice ustálené názvy. Pro připomenutí: Přirozená čísla: počty objektů, se kterými se setkáváme v realitě, 1, 2, 3, 4,. Jejich množinu obvykle značíme N (POZOR do přirozených čísel nepatří 0 ani záporná čísla) Celá čísla: přirozená čísla, doplněná o 0 a o záporná čísla. Obvykle je označujeme symbolem I. Racionální čísla: čísla, která je možno popsat zlomkem, kde v čitateli i jmenovateli je celé číslo. (Pokud jsou zapsána v desetinném tvaru, pak má buď jen konečně mnoho nenulových desetinných míst, nebo se jeho desetinná místa od nějaké pozice dál periodicky opakují). Iracionální čísla: čísla, která je možno zapsat pouze v desetinném tvaru s nekonečným množstvím platných nenulových cifer, ve kterých neexistuje neomezené periodické opakování. Reálná čísla: racionální a iracionální čísla. Obvykle je označujeme symbolem R. 1. Kybernetika a informatika a jak je vnímat Kybernetika, jedna z věd, které změnily podobu dvacátého století a úspěšně v tom pokračují i ve století následujícím, není nijak stará. Je ale pravda, že její název se vyskytl už v 19. století. V roce 1834 slavný fyzik Adrien-Maria Ampére ( ) na stará kolena sestavil utříděný systém věd a zařadil mezi ně zatím neexistující, ale jím očekávanou, vědu o řízení lidské společnosti kybernetiku. Když se podíváme na dnešní obsah toho slova, máme pocit, že se ještě držel dost při zemi. Dnes je kybernetika definována jako věda o sdělování a řízení v živých organismech, strojích a lidské společnosti. Její moderní pojetí i současný název jsou spojovány hlavně se jménem Norberta Wienera ( ), amerického matematika, který v roce 1948 uveřejnil knihu Cybernetics or Control and Communication in the Animal and Machine, od jejíhož vydání se vznik kybernetiky obvykle počítá. Jak už tomu ale bývá, není to s datem vzniku kybernetiky a s kybernetikou samotnou ani zdaleka tak jednoznačné. Jen za cenu značného zjednodušení se dá o kybernetice mluvit jako o jedné vědě. Mnohem spíš je to jakási nepříliš ostře vyhraněná skupina vědních oborů, spojených matematickým přístupem k problémům řízení a informací, a hlavně společným paradigmatem že totiž pro řadu jevů a procesů není podstatný jejich hmotný nosič, ale struktura, kterou svou existencí vytvářejí. Zní to moc složitě a tak si věci trochu rozebereme. Začneme výrokem už jmenovaného Norberta Wienera, který svého času napsal: Existence života není existencí kamene, ale existencí víru na vodě. Názorně tak ukázal na příklad kybernetického myšlení není podstatné, zda nějaký proces (v našem případě vír) probíhá ve vodě, vzduchu, písku nebo proudícím davu lidí, to se pořád mění; podstatná je jeho vnitřní struktura, zákonitosti, kterými se řídí jeho existence. A stejně je to z hlediska kybernetiky s mnoha složitými jevy kolem nás

9 Myšlenka, že by něco takového mohlo otevřít nové cesty k poznání obecných zákonitostí, kterými se řídí náš svět, se více méně současně začala v první polovině dvacátého století objevovat v řadě vědních oborů. V biologii, fyziologii, neurologii, v mechanice, ve vývoji strojních řídících systémů, v ekonomických bádáních, později i v šifrovacích metodách, ve sdělovací technice a mnohde jinde. Wiener se svými společníky, o kterých si ještě řekneme, jenom shrnul existující trendy a dal jim sjednocující metodiku opřenou o moderní (a poměrně abstraktní) matematiku. Máme-li být přesní a spravedliví, ani on nebyl ve své snaze první. Nejde teď o slovníkový experiment pana Ampéra, ale o technické i teoretické práce, které budoucí kybernetiku skrytě ohlašovaly už dávno předem. Už v antice a ve středověké Číně se vyskytovala zařízení, sestrojená šikovnými vynálezci, ve kterých se vyskytoval základní princip moderní kybernetické teorie řízení, zpětná vazba. Definitivně ji do technické praxe prosadil James Watt ( ), když ji v roce 1765 uplatnil ve svém parním stroji. O víc než století později udělal pozoruhodný krok ke kybernetice náš rodák Jaroslav Hrdina ( ). Narodil se v Plzni, ale protože se s ním rodiče velmi brzy odstěhovali do Ruska, kde otec našel výhodné zaměstnání vojenského hudebníka, je známější jako Jaroslav Ivanovič Grdina. Vystudoval na báňského inženýra a většinu života strávil jako vedoucí katedry mechaniky na Technickém učilišti v Jekatěrinoslavi (dnešním Dněpropetrovsku) na Ukrajině. Vychoval hodně mladých inženýrů a ve volných chvílích se zabýval zkoumáním podobnosti mezi lidským tělem a mechanickým zařízením. Ne jako renesanční hodináři, kteří v pohyblivých figurkách napodobovali vnější dojem. Zkoumal jednotlivé klouby a části lidského těla jako mechanická zařízení kosti jako páky, klouby jako pohyblivé spoje, šlachy jako táhla, svaly jako motory nebo pružiny (přitom zavedl představu servomotoru o víc než třicet let dřív, než to udělal H. L. Hazen roku 1934 v knize Theory of Servo-Mechanism). O svých bádáních uveřejnil mezi lety 1898 a 1924 celkem 27 odborných článků. Vyšly sice v ruštině, přesto ale stačily později zaujmout Wienera (který uměl rusky) a jeho kolegy, kteří Grdinu označili za svého inspirátora a jeho práce za popud k jejich vlastnímu bádání. Poctivě vzato, čistá kybernetika to ještě nebyla. Grdina se omezil na mechanické jevy a nezkoumal intelektuální struktury, jako je řízení a přenášení signálů, nicméně, důležitý krok udělal. Pak už bylo ke kybernetice jen krůček. Někteří autoři považují za první kybernetické dílo knihu rumunského lékaře Stefana Odobleji ( ) žijícího v Paříži, která má titul Psychologie consonantiste a vyšla v roce Je ale přeci jen moc zaměřena na psychologické problémy a na tu část kybernetiky, která má blízko ke studiu lidského myšlení, takže se její prvenství obecně neprosadilo. Totéž se nedá říci o článku Behaviour, Purpose and Teleology, který vyšel v roce 1943 a existuje hodně kybernetiků, kteří dějiny své vědy počítají právě od něj. Článek má tři autory, nám už známého Norberta Wienera, mexického lékaře, fyziologa s výbornou znalostí matematiky Arturo Rosenbluetha ( ) a inženýra Juliana Bigelowa ( ), který se později proslavil významným podílem na konstrukci prvního digitálního počítače IAS. Ve stejném roce jako Wienerova kniha, tedy v roce 1948, vyšel článek autorů Clauda Shannona ( ) a Warena Weavera ( ) nazvaný A mathematical theory of communication. Bývá dost často označován jako Charta Magna informačního věku a je také zakladatelskou prací teorie informace, které především jsou věnována tato skripta. Claude Shannon, který zřejmě byl hlavním autorem, se proslavil i v počítačových vědách ještě jako student v roce 1937 ve své diplomové práci poprvé vypracoval metodu využití abstraktní Boolovy algebry při konstrukci počítačových zapojení a tím založil nový vědní obor, teorii logických obvodů. Autorům diplomových prací se něco takového obvykle nestává. Aby to nebylo všechno, tak v padesátých letech vstoupil do diskuse o možnosti umělé inteligence tím, že sestrojil první elektronické zařízení, které se samo učí. Dodnes se mu říká Shannonova myš (on sám ji pojmenoval Theseus podle hrdiny v krétském labyrintu) Když jsme se seznámili s prehistorií kybernetiky, neměli bychom vynechat ještě jeden častý omyl. Mnozí lidé kybernetiku, hlavně v jejích počátcích, ztotožňovali s počítači, nebo jejich konstrukci považovali přinejmenším za její hlavní část. Mýlili se, kybernetika je především teoretická matematická disciplína, přesněji řečeno, spojení matematických disciplín zaměřených na - 9 -

10 problematiku zmíněnou v její definici. Nicméně, jednou ze společných vlastností živých organismů a technických zařízení je také přinejmenším potenciální možnost inteligentního chování dnes se o ní mluví jako o umělé inteligenci. Ať už tím myslíme cokoliv. Technickým zařízením, které k němu má nejblíž, je počítač. Už proto na sebe počítače a jejich vývoj přitáhly v dějinách kybernetiky pozornost. Přidejme k tomu ještě jednu okolnost, která hlavně v době těsně před druhou světovou válkou a během ní hrála větší roli, než si dnes umíme představit. V první polovině dvacátého století udělaly přírodní vědy, a mezi nimi hlavně fyzika, ohromný pokrok. Byly schopny řešit velmi náročné problémy a některé z nich vyžadovaly provedení mimořádně obtížných a rozsáhlých výpočtů. Teorie potenciálu, jaderná, částicová a subjaderná fyzika, kosmologie a další obory se opíraly o složité počítání. Je paradoxní, že pro ně měli vědci jenom mechanické kalkulačky známé z účtáren, opatřené kličkou nebo malým elektromotorkem, který otáčel kolečky. Po programovatelnosti nebylo ani vidu ani slechu, paralelnost výpočtů zajišťovala souběžná práce několika výpočtářů, kteří přitom o podstatě svého konání neměli ani zdání. Teprve za války (byla to ta druhá světová) se objevovala specializovaná zařízení na řízení palby (hlavně protiletadlových děl) a na dekódování rafinovaných šifer. Zkušenosti s jejich konstrukcí posunuly po válce vývoj počítačů kupředu a kybernetika k tomu dodala teoretické principy, kterými se konstrukce počítačů a tvorba algoritmů řídí dodnes. Vraťme se ale ke kybernetice a jejímu vývoji. Už víme, že kybernetika je vlastně souhrn několika různých oborů (v jedné z klasifikací jejích podoborů je možné najít přes padesát hlavních položek a mnohem víc jejich dílčích částí). To, že se všechny vešly pod hlavičku kybernetiky, ještě neznamenalo, že se vyvíjely shodně a stejným tempem. Jak už to ve vědě bývá, každý z podoborů kybernetiky se větvil na samostatná témata a každé z nich pokračovalo ve svém vývoji. Někdy je bylo možné zobecnit na společný základ, někdy se jejich vývoj naplnil a vplynuly do jiných oborů, většinou se od sebe ale vzdalovaly. Dokonce i samo slovo kybernetika poněkud vyšlo z módy a užívá se dnes spíš ojediněle. To ale neznamená, že zmizela i ona sama jen vstoupila do specializovaných oborů, které se v jejím rámci vytvořily. Jedním z nich je informatika. Co všechno onen termín zahrnuje, na to není dodnes úplně jednotný názor. V některých zemích a prostředích se do informatiky zahrnují jenom tak zvané počítačové vědy teorie algoritmů a algoritmické složitosti, teorie logických obvodů a sítí, teorie automatů a jim blízké segmenty jiných oborů. Opačným extrémem jsou komunity, které do informatiky zahrnují každou práci s informacemi, včetně žurnalistiky, zpravodajství a dalších matematice vzdálených činností. Konečně je tady pojetí, které se prosadilo, nebo alespoň prosazuje v našem prostředí. Chápeme informatiku jako tvůrčí syntézu vybraných partií ze tří oblastí vědeckého zájmu. Především jsou to matematické a kybernetické disciplíny, které souvisejí se získáváním a zpracováním informací, dále jsou to reálné technické možnosti aktuální a dostupné výpočetní techniky a konečně do informatiky zahrnujeme i partie ostatních věd a technického vývoje, které se na ni obracejí s potřebou řešit své specifické problémy a dodávají jí tím témata pro další vývoj, stejně jako testovací materiál pro její vlastní metody. Nás budou v těchto skriptech zajímat především matematické a matematicko-kybernetické metody, které do informatiky vstupují. Stručně a rámcově se seznámíme s jejich hlavními metodami a výsledky a hlavně s jejich přístupem k analýze a řešení problémů. Mezi ty nejdůležitější budou patřit metody matematického modelování a zpracování konkrétních reálných dat, se všemi rušivými vlivy, které na ně mohou působit. Dále pak základy teorie informace, hlavně vlastnosti zdrojů informace a možnosti jejího použití při porozumění konkrétním situacím. 2. Intuitivní teorie množin Nejdřív ze všeho bychom měli uvést na pravou míru slovo intuitivní v záhlaví této kapitoly. V běžném hovorovém jazyce by naznačovalo myšlenkové pochody, které, na rozdíl od logicky přesné matematiky, staví spíš na pocitech a dojmech. V daném případě tomu tak není

11 Lidé, přesněji řečeno matematici, už od nepaměti pracují s množinami, sjednocují je, hledají jejich doplňky, aniž by si uvědomovali, že rozvíjejí nějakou přesnou a dobře stavěnou teorii, dokonce, aniž by znali nebo užívali slovo množina. Připadalo jim to samozřejmé a přirozené, asi jako posouvat kuličky na drátech počitadla a také to tak přirozené bylo. Zhruba v poslední čtvrtině devatenáctého století ale dolehly na matematiku značné potíže. Původně souvisely s otázkou, jak porovnávat počet prvků nekonečných množin (konkrétně počet racionálních, iracionálních a reálných čísel). Při jejich řešení, které se zprvu zdálo být jednoduché (stačilo přece sáhnout po množinách a pohrát si s jejich velikostmi), se vynořilo několik paradoxů, které otřásly samými základy matematiky. Nakonec se našlo jejich řešení, založené na hodně zobecněné a zabstraktnělé modifikaci pojmu množina a pro tuto abstrakci se od té doby užívá název teorie množin bez dalších přívlastků. Stala se dokonce součástí vědy, které se říká metamatematika a ve které spolu s matematickou logikou vytváří ty nejzákladnější obecné nástroje pro spolehlivé matematické uvažování. Současně se oné původní, názorné a i laikovi srozumitelné teorii množin začalo říkat intuitivní. V oné intuitivní teorii množin, která nás bude v dalším textu zajímat, se slovem množina rozumí jakákoli třída prvků, vybraná z nějaké základní množiny, obvykle nazývané univerzum. Například množina sudých čísel je vybrána z univerza přirozených čísel, množina čajových šálků je vybrána z univerza nádobí a podobně. V dalším pokračování této podkapitoly budeme symbolem U označovat univerzum, ve kterém se pohybujeme, x, y, z, budou prvky univerza a symboly A, B, C, jeho podmnožiny, z našeho pohledu množiny, kterými se zabýváme. Symbolem x A nahradíme slovní obrat prvek x patří do množiny A a naopak, symbol x A čteme jako prvek x nepatří do množiny A. Množinu je možné v klasické teorii množin popsat (tedy vybrat z příslušného univerza) dvěma dost odlišnými způsoby: Buď můžeme vytvořit seznam jejích prvků, ve kterém každý prvek konkrétně uvedeme. Takový popis je reálně možný jen v případě konečných a nepříliš početných množin. Nebo můžeme stanovit pravidlo, podle kterého můžeme o každém objektu, se kterým se setkáme, určit, zda je prvkem popisované množiny (například sudá čísla jsou celá čísla, beze zbytku dělitelná dvěma). Takovým způsobem je možné popsat i nepřehledně velké, případně nekonečné, množiny. V případě potřeby se při popisu množiny používá symbol kroucených závorek { }, a to buď ve tvaru {x, y, z, }, pokud je množina popsána jako seznam, nebo ve tvaru pokud je množina popsána pomocí pravidla. {x U: x vyhovuje pravidlu P}, Oba uvedené popisy jsou v klasické teorii množin považovány za rovnocenné. V moderní teorii polomnožin a z ní odvozené alternativní matematiky je rozdíl mezi nimi považován za podstatný a reprezentuje rozdíl mezi polomnožinou a množinou. Formální pojmy, uvedené v předchozí specifikaci pojmu množina (univerzum, způsob popisu množiny), mohou na první pohled připadat jako schválnost nebo lpění na bezvýznamných maličkostech. Není tomu tak. Buďte si jisti, že skoro všechny potíže, které vás při zacházení s množinami v budoucnu potkají, budou mít původ v tom, že jste si neujasnili, co je ve vašem případě vlastně univerzum, co je jeho podmnožina a co její prvek. Případně, podle jakého pravidla jste prvky univerza třídili na prvky a ne-prvky vámi uvažované množiny. Je užitečné, naučit se s množinami manipulovat prostřednictvím množinových operací. Předpokládejme, že A a B jsou množiny ze stejného univerza U. Pak říkáme, že:

12 Množina A je podmnožinou množiny B, značíme symbolem A B, jestliže každý prvek x z A je také prvkem B. Jsou-li A a B dvě množiny, pak symbolem A B označíme množinu, kterou nazýváme sjednocením množin A a B a která je definována popisem A B = {x U: x A nebo x B}. Podobně, jsou-li A a B dvě množiny, pak symbolem A B označíme množinu, kterou nazýváme průnikem množin A a B a která je definována popisem A B = {x U: x A a současně x B}. Jsou-li A a B dvě množiny, pak symbolem A\B označíme jejich rozdíl popsaný vztahem A\B = {x U: x A a současně x B}. Je-li A množina, pak symbolem Ā označíme její doplněk, definovaný popisem Ā = {x U: x nepatří do A}. Univerzum už jsme označili symbolem U a zbývá ještě označit symbolem prázdnou množinu. Je-li průnik dvou množin A a B prázdný, říkáme, že tyto množiny jsou disjunktní. Manipulace s množinami na úrovni jejich intuitivní teorie je poměrně názorná. Připomenutí si zaslouží asi jen jedno ze základních pravidel. De Morganova věta. Jsou-li A a B dvě množiny, pak (A B) = A B a (A B) = (A B) Pro potřeby těchto skript víc o množinách vědět nepotřebujeme. 3. Logické operace a symboly Logické operace a související pojmy patří k základní teoretické výbavě informatiků a matematická logika se studuje ve specializovaných předmětech. Nicméně neuškodí, když si sjednotíme pojmy a symboliku vyhneme se tím nepříjemným nedorozuměním při rozboru matematických zákonitostí, kterými se budeme zabývat. Logika kdysi vznikla a vyvíjela se (zhruba do devatenáctého století) jako součást spíš filozofie než matematiky. V centru jejího zájmu byly manipulace s výroky a otázka, jak ony manipulace ovlivňují pravdivost výsledných výroků. Tak je tomu, ostatně, dodnes jen jsou výrokové operace popisovány řečí vzorců a ne sofistikovaným přerovnáváním vět víceméně přirozeného jazyka. Spolu s teorií množin bývá logika často zařazována do tak zvané metamatematiky, což v tomto případě nemá naznačovat nic esoterického, ale pouze skutečnost, že obě uvedené vědy poskytují matematice její nejzákladnější nástroje, stavební kameny a metodické nástroje. 3.A Výrokový počet Základním pojmem logiky, i té matematické, je výrok. Je to každé tvrzení, které může být buď pravdivé, nebo nepravdivé. Například: Praha je město, 8 je víc než 5, Ryby mají plíce, jsou výroky (pravdivé, případně nepravdivé, nikdy ne oboje současně). Přitom není nutné, aby pravdivost výroku byla v dané chvíli

13 ověřitelná například: Na Marsu je život je výrok (buď tam život je nebo tam není), i když ve chvíli, kdy vzniká tato kapitola nikdo bezpečně neví, zda to je nebo není pravda. Naopak: Praha je velké město (pro někoho ano, pro někoho ne jde o subjektivní postoj), x je větší než 5 (nevíme, jak velké je x), Ptáci létají (někteří ano, někteří ne, někteří jen poletují na krátké vzdálenosti), jsou příklady tvrzení, která nejsou výroky. Z některých se ale vhodným doplněním mohou výroky stát. Nadále se budeme zabývat jen výroky. Víme už, že mohou být buď pravdivé, nebo nepravdivé a to, zda je výrok pravdivý nebo nepravdivý budeme nazývat jeho pravdivostní hodnotou. Shodně s programovacími jazyky budeme pravdivostní hodnoty označovat písmeny T (true), je-li výrok pravdivý a F (false), je-li nepravdivý. S výroky se dá různě manipulovat, hlavně je můžeme spojovat do složitějších celků, a při zpracování informací obsažených ve výrocích nás bude zajímat hlavně to, co se při takové manipulaci děje s pravdivostními hodnotami výroků. Začněme se spojováním několika výroků. Jeho výsledkem je zase nějaký složený výrok, který má svou vlastní pravdivostní hodnotu. Ke spojování výroků užíváme tak zvané logické spojky jsou to slova běžného jazyka (nemusí to nutně být spojky v mluvnickém smyslu), která ale mají v logice přesně daný význam. Aby při užívání slov běžného jazyka nedocházelo ke zbytečným nedorozuměním, ustálil se zvyk, používat místo běžných slov formální grafické symboly. V následujících částech budeme výroky označovat symboly V, V, V 1, V 2, V 3, atd. První logická spojka je negace. V běžném jazyce odpovídá slovům ne nebo není pravda, že a týká se vždy jednoho výroku. Vztahuje se k jednomu výroku a značí se symbolem, takže V čteme není pravda, že platí výrok V. Jestliže má výrok V pravdivostní hodnotu T, má jeho negace V pravdivostní hodnotu F a naopak. Další z logických spojek už opravdu spojuje dva výroky a nazývá se logická konjunkce. Odpovídá mluvnické spojce a nebo slovnímu spojení a současně platí. Označuje ji symbol vložený mezi oba výroky, například V V čteme platí V a V. Konjunkce dvou výroků je pravdivá jenom tehdy, jsou-li pravdivé oba vstupní výroky současně. Ve všech ostatních případech má pravdivostní hodnotu F. Protipólem logické konjunkce je logická disjunkce. Do jisté míry odpovídá mluvnické spojce nebo. Jak hned uvidíme, není s ní ale, aspoň v češtině, totožná. Značí se symbolem vloženým mezi dva výroky a zápis V V čteme jako platí V nebo V. Poznámka 3.1. V mluvené češtině bývá spojka nebo často vnímána jako vylučovací nečeká se, že by platily obě alternativy současně. Logická disjunkce není vylučovací při jejím použití může platit jedna nebo druhá možnost, ale mohou platit i obě současně. Zbývající dvě logické spojky, které tady uvedeme, jsou užitečné zejména při odvozování logických závěrů ze známých výroků, ale nejen při něm. První z nich je implikace. Spojuje dva výroky, vyslovuje se obvykle z plyne, nebo je postačující podmínkou pro platnost, případně také je nutnou podmínkou pro. Obvykle se značí symbolem (někdy jenom ) vloženým mezi dva výroky. Zápis V V pak znamená, že z V plyne V, nebo že V je postačující podmínkou pro V, případně V je nutnou podmínkou pro V (pozor na pořadí výroků). Poslední logická spojka, která nás bude zajímat, je ekvivalence. Spojuje také dva výroky a obvykle se čte je ekvivalentní s nebo platí právě tehdy když a zejména ve starší literatuře je možné vidět i formulaci platí tehdy a jen tehdy, když. Její symbol je obvykle (někdy i ), vkládá se mezi dva výroky a V V, se čte V je ekvivalentní s V, popřípadě V platí právě tehdy, když platí V. Ekvivalence je pravdivá tehdy, když jsou oba výroky současně pravdivé, nebo oba současně nepravdivé

14 Použitím logických spojek vytváříme z jednodušších výroků výroky složené. Jejich pravdivostní hodnoty se snadno odvodí z pravdivostních hodnot vstupních výroků způsobem, který jsme si v podstatě popsali v předchozích odstavcích a který se dá zhustit do několika jednoduchých tabulek. negace konjunkce disjunkce V V V V V V V V V V T F T T T T T T F T T F F T F T Tabulky 1 5 implikace F T F F T T F F F F F F ekvivalence V V V V V V V V T T T T T T T F F T F F F T T F T F F F T F F T Povšimnutí si zaslouží implikace, která se možná nekryje s běžnou představou logického vyplývání. Především, tak jak je definována, její pravdivostní hodnota závisí jenom na pravdivostních hodnotách vstupních výroků a nepožaduje se věcná souvislost mezi nimi nebo faktické odvození důsledku z předpokladu. Například implikace Jan Žižka zemřel v patnáctém století a z toho plyne, že Měsíc obíhá kolem Země. je po formální stránce zcela korektní a má pravdivostní hodnotu T. Druhý důvod, proč může implikace nepřipraveného studenta překvapit, je to, že ať plyne z nepravdivého předpokladu cokoli, je implikace jako celek pravdivá. Když se ale trochu víc zamyslíme nad naším vlastním způsobem uvažování, uvědomíme si, že se vlastně od právě popsaného pravidla neliší. Okřídlená věta Jestli je toto pravda, pak jsem papež. neříká vlastně nic jiného, než že z nepravdivého předpokladu může plynout opravdu cokoliv. To nejpodstatnější, co bychom si měli z předchozích odstavců odnést, je poznání, že i logiku je možné, a dokonce výhodné, přenést ze světa slov do světa jednoduchých a přehledných vzorců. Ušetří nám to intelektuální námahu spojenou se sledováním mnohomluvných textů a místo ní nabízí pro práci s výroky jednoduché aritmetické metody. 3.B Tautologie Pomocí logických spojek, které jsme uvedli v předchozích odstavcích, můžeme tvořit složené výroky. Například výrokový vzorec (V 1 V 2 ) V 3 nám říká, že pokud jsou současně pravdivé výroky V 1 a V 2, pak je pravdivý i výrok V 3. Takový složený výrok může být jako celek pravdivý nebo nepravdivý (jinými slovy, může nabývat pravdivostní hodnoty T nebo F), podle toho, zda byly pravdivé nebo nepravdivé vstupní výroky. Na první zběžný pohled nám může připadat ověřování pravdivosti složeného výroku jako dost nepřehledná a intelektuálně namáhavá práce, s využitím pravdivostních tabulek uvedených v předchozí části se z toho ale stává celkem jednoduchá a hlavně mechanická záležitost

15 Tabulka 6 V 1 V 2 (V 1 V 2 ) (tabulka pro ) V 3 (V 1 V 2 ) V 3 (tabulka pro ) T T T T T T T T F F T F F T T T F F F T F T F T T F T F F T F F F T T F F F F T Mezi složenými výroky existuje jedna zvláštní skupina. Pozná se podle toho, že pro jakoukoliv kombinaci pravdivostních hodnot vstupních výroků je jeho vlastní pravdivostní hodnota vždy T (je vždy pravdivý). Takové složené výroky se nazývají tautologie a při logickém usuzování i při programování s logickými proměnnými mají svůj zvláštní a důležitý význam. Některé slavné tautologie byly známy už v antickém Řecku a staly se základem logických důkazů a spolehlivých úvah nejen v antice, ale po celý středověk a notný kus novověku. Dokonce si vysloužily latinská jména. Jsou to, například: V ( V) (V V ) ((V 1 V 2 ) V 1 ) V 2 ((V 1 V 2 ) ( V 2 )) ( V 1 ) ((V 1 V 2 ) (V 2 V 1 )) (V 1 V 2 ) Zákon vyloučení třetí možnosti (tertium non datur). Zákon sporu nikdy neplatí současně výrok a jeho opak (reductio ad absurdum). Odvozovací pravidlo je-li pravdivá implikace a je-li splněn její předpoklad, pak je pravdivý i důsledek (modus ponens). Je-li implikace správná a přitom neplatí její důsledek, pak nemůže být splněn ani její předpoklad (modus tolens). Ekvivalence je totéž jako oboustranná implikace. 3.C Kvantifikátory Už víme, že výrok je každé tvrzení, o kterém je v principu možné rozhodnout, zda je pravdivé nebo nepravdivé. To znamená, že například tvrzení x je větší než 5 nebo stůl je dřevěný nejsou výroky některé x je větší než 5 a některé stoly jsou dřevěné, pro jiná x a jiné stoly to ale pravda není, dokud jednoznačně nespecifikujeme, které x a který stůl máme zrovna na mysli. Takovým tvrzením, jejichž pravdivostní hodnota závisí na výběru konkrétní hodnoty nějakého proměnného parametru, se obvykle říká výrokové funkce a bývá zvykem je také značit způsobem, pro funkce obvyklým, tedy V(x), V (stůl) a podobně. Existuje ale ještě jedna cesta, jak z podobných tvrzení udělat výroky pomocí tak zvaných kvantifikátorů. Existují hlavní dva druhy kvantifikátoru existenční kvantifikátor, který se vyjadřuje slovy existuje prvek univerza x U pro který platí výrok V, a který se v symbolech zapisuje x U (V(x)=T), nebo stručněji, x U V(x). Druhý typ se nazývá obecný kvantifikátor, vyjadřuje se slovy pro všechny prvky z univerza platí výrok V a jeho symbolický zápis je x U (V(x)=T), stručněji x U V(x)

16 Takto vytvořený zápis jako celek je také složený výrok a nabývá tedy jednu z pravdivostních hodnot T nebo F. Zatímco existenční kvantifikátor je v jistém smyslu jakási společná logická disjunkce pro všechny výroky, které vzniknou z výrokové funkce V(x) dosazením prvků univerza U, je analogicky možné považovat obecný kvantifikátor za podobně společnou logickou konjunkci všech výroků, které vzniknou z výrokové funkce V(x) dosazením prvků z univerza. Existenční kvantifikátor, tak jak jsme si ho tady zavedli, nevylučuje, že výrok neplatí pro víc než jeden prvek z univerza (bez problémů třeba pro všechny), k tomu, aby nabýval pravdivostní hodnotu T ale stačí, když výrok platí alespoň pro jednu hodnotu parametru. Poměrně často, hlavně při rozboru množiny řešení nějakého problému, je ale důležité, že výroková funkce platí (nabývá pravdivostní hodnotu T) pro nějakou hodnotu parametru a určitě ne pro víc hodnot. Pak říkáme, že výrok V platí pro právě jeden prvek univerza (ve starší literatuře nacházíme formulaci pro jeden a jen jeden ) a symbol existenčního kvantifikátoru se doplňuje vykřičníkem:! x U (V(x)=T), nebo stručněji,! x U V(x). 4. Elementární počet pravděpodobnosti Ještě poměrně nedávno bylo snadné koupit učebnice, ve kterých byl náhodný jev definován jako jev, který nastává náhodně a náhodná veličina jako veličina, která nabývá náhodných hodnot. Je pravda, že v této kapitole chceme připomenout některé z nejzákladnějších vztahů počtu pravděpodobnosti v jeho skoro-původním tvaru, ale k dětinskostem podle právě uvedených příkladů se raději neuchýlíme. 4.A Základní definice Místo toho budeme předpokládat, že máme k dispozici nějakou základní množinu U, ze které vhodným mechanismem vybíráme jednotlivé prvky. V základní množině existují podmnožiny, jednu z nich si označíme třeba A, a nás zajímá, jestli vybraný prvek x U bude spadat do A. Pokud jsme schopni dost jednoznačně rozeznat, jestli se tak stalo, budeme množině A říkat náhodný jev. Vyhlídku, že se podaří vybrat x z U tak, aby x patřilo do A, nazveme pravděpodobností náhodného jevu A. Matematika si náhody ani pravděpodobnosti dlouho nevšímala. Není divu, nezdálo se, že by přesná a jednoznačná matematika mohla mít něco společného s nejistou náhodou. Až poměrně pozdě, v renesanci, si Ital Girolamo Cardano ( ) všiml, že dokonce i náhoda může nabídnout něco, co je pro matematiku stravitelné. Jednotlivé náhodné pokusy (v našem dosavadním názvosloví výběry x z U) jsou sice, nepředvídatelné a nezpracovatelné matematickými metodami, neplatí to ale pro mnohonásobné opakování takového výběru. Pro ty už nějaké zákonitosti platí a dokonce se dají formulovat matematicky. Cardano byl svým způsobem pozoruhodný člověk. Vystudoval medicínu, nějakou dobu se živil jako lékař, ale celý život toužil po místě univerzitního profesora medicíny. Na sklonku života se mu to dokonce splnilo. Mnohem dřív ale přednášel na univerzitě matematiku, ke které měl mimořádný talent a kterou obohatil významnými objevy. Jeho úplně největší vášní ale byly hry jakékoli. Kostky, karty, šachy a kdoví co ještě. Prohrál v nich všechno, co vydělal, i věno své manželky a tak se ani nemůžeme divit, že se snažil přijít na kloub náhodě, kterou ze svých proher vinil. Napsal o náhodě dokonce útlou knížku (měla pouhých 15 stran), která vyšla tiskem až dost dlouho po jeho smrti, když byly pietně vydány všechny jeho spisy. Je pozoruhodná tím, že v ní jako první definuje pravděpodobnost, o mnoho víc se o ní ale nerozepisuje. Formulováno v jazyce a symbolech, které tady používáme, definoval Cardano pravděpodobnost náhodného jevu A jako číslo P(A), dané zlomkem

17 počet prvků v množině A P(A) = počet prvků v základní množině U Řečeno slovy trochu bližšími Cardanovi, šlo o zlomek počet možných příznivých výsledků náhodného pokusu P(A) = počet všech teoreticky možných výsledků téhož pokusu a v literatuře bývá obvykle nazýván četnostní definice pravděpodobnosti. Má jednu velkou výhodu podle Zákona velkých čísel, což je exaktně dokázaná matematická věta, se při provádění náhodného pokusu (pokud jsou splněny velmi benevolentní předpoklady) poměr četností příznivých výsledků pokusu k počtu všech výsledků, skutečně blíží skoro vždy k pravděpodobnosti. Jen pro názornost. Obvyklá hrací kostka má šest stran a neměla by dopadnout jinak, než na některou z nich. Počet všech možných výsledků náhodného hodu je tedy 6. Jestliže dvě strany obarvíme červeně a zbylé čtyři modře, víme už díky Cardanovi, jaká je pravděpodobnost, že kostka dopadne červenou stranou nahoru. Ze všech možných šesti výsledků hodu jsou dva příznivé padla při nich červená strana. Podle Cardana je P(červená) = 2 6 = 1 3. Cardano byl zkušený hráč v kostky a předchozí příklad by ho musel uspokojit i kdyby o matematice neměl tušení. Uměl spočítat pravděpodobnosti i pro o něco složitější situace, o moc dál se ale přeci jen nedostal. Asi sto let po něm žili pánové Pierre de Fermat ( ) a Blaise Pascal ( ), kteří přišli na to, jak se s Cardanovými pravděpodobnostmi počítá. Po nich v tom pokračovali další a postupně vznikl počet pravděpodobnosti. My si z něj připomeneme jen několik základních pojmů a vztahů, ty ostatní jsou předmětem studia ve specializovaném předmětu. Především si pro jistotu připomeňme, že Cardanova definice pravděpodobnosti s typickým podílem úspěšné ke všem, původně mlčky předpokládala, že základní množina U je konečná. Časem (a poměrně brzy) se ji podařilo rozšířit na obecnější nekonečné a spojité základní množiny, my ale zůstaneme u předpokladu konečnosti množiny U. V následujících kapitolách, kde se budeme zabývat informací a sdělováním s pomocí konečných abeced, nám to stačí. Pak nám nic nebrání popsat pravděpodobnost P pomocí funkce f P, která zobrazuje množinu U do uzavřeného intervalu [0, 1] a pravděpodobnost P(A) nějakého náhodného jevu A U je pak P(A) = x A f P (x). Z toho už je pak zřejmé, že pro jednoprvkovou množinu A={x} je P(A)= f P (x) a že také pro dva disjunktní náhodné jevy A a B je P(A B) = P(A) + P(B). V následujících kapitolách budeme potřebovat několik nejzákladnějších vztahů, platných pro pravděpodobnosti. Pro každé dva náhodné jevy A a B a pro prázdnou množinu U platí, mimo jiné, také následující vlastnosti: 0 P(A) 1, P( ) = 0, P(U) = 1, pro A B je P(A) P(B) a obecně P(A B) = P(A) + P(B) P(A B). 4.B Podmíněná pravděpodobnost Velmi často se setkáváme s tím, že pravděpodobnost nějakého náhodného jevu závisí na tom, zda nastal nějaký jiný náhodný jev. To vede k pojmu podmíněné pravděpodobnosti, kterou obvykle označujeme symbolem P(A B), který čteme jako pravděpodobnost náhodného jevu A za podmínky, že nastal náhodný jev B. Podmíněná pravděpodobnost je definována vztahem

18 P(A B) P(A B) = P(B) a platí pro ni, mimo jiné, následující samozřejmé vztahy P(A A) = 1, P(A) P(B A) = P(B) P(A B) Nejvýznamnější ze vztahů platných pro podmíněné pravděpodobnosti formálně popisuje tak zvaná Bayesova věta, podle které: P(A) P(B A) P(A B) = P(B) Důležitým pojmem spojeným s náhodnými jevy je jejich nezávislost. Náhodné jevy A a B označujeme za nezávislé, jestliže pravděpodobnost jevu A nezávisí na výskytu jevu B a naopak. V řeči vzorců, jestliže P(A B)=P(A) a také P(B A)=P(B) Není problém dokázat, že náhodné jevy A a B jsou nezávislé právě tehdy, když P(A B) = P(A) P(B) 4.C Náhodné procesy Kapitolu ukončíme připomínkou pojmu, který bude v následujících částech knihy také hodně důležitý. Pořád budeme předpokládat, že máme k dispozici nějakou základní množinu (univerzum) U, případně nějakou její podmnožinu X, a že máme definované rozložení pravděpodobnosti P na množině X. Je-li x X, pak pravděpodobnost prvku x budeme obvykle zapisovat P(x) (místo správnějšího P({x})). Nejdřív si názorně popíšeme, co můžeme s množinou X a rozložením pravděpodobností P také dělat. Můžeme s použitím těchto pravděpodobností vybírat postupně prvky x 1, x 2, x 3,, x n-1, x n, (vždy pouze zaznamenat, že byly vybrány a hned je vrátit zpět, aby se neměnily pravděpodobnosti P(x) ). Záznam vybraných prvků v pořadí, ve kterém byly vybrány, tvoří posloupnost. Konkrétní posloupnost, která vznikla náhodným výběrem, je samozřejmě náhodná, se stejnou množinou X a stejnými pravděpodobnostmi P(x) mohlo vzniknout mnoho jiných náhodných posloupností. Pro to, co jsme právě intuitivně popsali, existují přesnější termíny. Dvojice (X,P), tedy množina, ze které vybíráme prvky, a pravděpodobnostní rozložení podle kterého je vybíráme, se nazývá náhodný proces. Konkrétní posloupnost, která výběrem vznikla, se nazývá realizace náhodného procesu (X,P). Rozložení pravděpodobností P nemusí být jednoduché, nepodmíněné, jaké jsme zatím používali. Pravděpodobnost výběru každého dalšího prvku realizace náhodného procesu, může záviset na tom, jaký prvek byl vybrán těsně před tím, nebo jaké dva prvky bezprostředně předcházejí, případně, jakých k prvků bylo vybráno před právě probíhajícím výběrem dalšího prvku. Náhodný proces pak je sice pořád tvořen množinou X, ale původní nepodmíněné pravděpodobnosti P(x) jsou nahrazeny podmíněnými pravděpodobnostmi, P(x n x n-1 ) nebo P(x n x n-2, x n-1 ), případně obecně P(x n x n-k, x n-k+1,, x n-2, x n-1 ). Náhodný proces (X,P), ve kterém jsou pravděpodobnosti výběru nezávislé na jeho předchozím průběhu, budeme nazývat nezávislým a jeho realizaci nezávislou realizací náhodného procesu nebo nezávislou náhodnou posloupností. Náhodné procesy s podmíněnými pravděpodobnostmi P(. x n-1 ), P(. x n-2, x n-1 ), nebo P(. n x n-k, x n-k+1,, x n-2, x n-1 ) budeme nazývat podmíněnými náhodnými procesy s podmínkou délky 1, 2, nebo k. 4.D Náhodná a pseudonáhodná čísla Poněkud zvláštní typ dat představují náhodná v případě počítačových programů vlastně pseudonáhodná, čísla. Většinou se dají najít v tabulkách nebo přímo v softwarové výbavě počítačů

19 nebo i lepších kapesních kalkulaček. Měli bychom ale znát několik jednoduchých pravidel pro zacházení s nimi. U nepoučených uživatelů totiž někdy bývá zacházení s náhodnými čísly dost lehkomyslné. Náhodným číslům se nevyhneme v řadě simulačních úloh, kdy je třeba, ať pro popis chaotické skutečnosti nebo pro účinné používání statistických metod, brát v úvahu přítomnost náhodných vlivů, nebo využít náhodu k potlačení zbytečné systematičnosti, která by nás nutila přeskakovat některé z mnoha možných variant postupu. Neinformovanému pozorovateli by se zdálo, že vyrobit náhodná čísla nemůže být žádný problém. Někdy to vypadá, že se chaoticky, tedy náhodně, chová větší část našeho okolí a pro náhodná data stačí jen sáhnout. Ve skutečnosti to, samozřejmě, není tak jednoduché. Především, od náhodných čísel pro účely matematických simulací požadujeme, aby měla několik vlastností. Všechny se odvozují od jedné, základní: Musí to být nezávisle vybrané hodnoty rovnoměrného rozložení pravděpodobnosti na uzavřeném intervalu [0,1]. Z toho pak bezprostředně plynou konkrétnější vlastnosti. Zejména: Výběr vypadá ve skutečnosti tak, že nějaký náhodný mechanismus vybírá čísla od 0 do 9 a ta jsou řazena do skupin (třeba po dvou, čtyřech nebo pěti, ). Tím reprezentují číslice desetinného zlomku z požadovaného intervalu [0,1] na požadovaný počet desetinných míst. Počet číslic ve skupinách odpovídá tomu, s jakou přesností (s kolika desetinnými místy) potřebujeme v konkrétní aplikaci s náhodnými čísly pracovat. Aby byl výběr skutečně náhodný, nesmí se v uspořádání vyskytovat cykly ani jiné pravidelnosti. Aby byly vybrané hodnoty rovnoměrně rozložené, nesmí se žádná z nich (ani žádná dvojice, trojice, ) vyskytovat v dostatečně dlouhém výběru víckrát než některé ostatní. Jiné rozložení pravděpodobností než rovnoměrné - nejčastěji to bývá normální (Gaussovo) rozložení je možné z vybraných náhodných čísel získat vhodnou transformací. Náhodná čísla je možné, alespoň teoreticky, získat několika způsoby. Pro praktického uživatele náhodných čísel je především možné (a rozumné) spolehnout se na to, že namáhavou práci už udělal někdo za nás a využít tabulky náhodných čísel (hojně se vyskytují například ve starších svazcích statistických tabulek) nebo použít počítač, ve kterém je dostatečná zásoba náhodných čísel zabudována. Ty uvozovky v předchozí větě ale mají své odůvodnění, ke kterému se ještě dostaneme. Ti, kdo takové tabulky tvoří, museli postupovat jinak. Především, a také historicky nejdřív, opakovaně používali nějaké mechanické zařízení (minci, kostku, losovací buben z loterií, a podobně). Tabulky náhodných čísel mají tu citelnou nevýhodu, že počet získaných náhodných čísel není (pokud se práce neujme patologický jedinec) nijak oslnivě rozsáhlý. Pro moderní aplikace, pracující s mohutnými soubory dat a s rozsáhlými simulacemi, je to nevýhoda podstatná. Složitější a vynalézavější povahy postupně pro tyto účely používaly různé fyzikální nebo chemické procesy (například uvolňování částic při radiaci, průběh některých chemických reakcí, a podobně). Byly doby, kdy se docela úspěšně používala i demografická data. Zpravidla bývají rychlejší než házení mincí, ale masivní soubory náhodných čísel také neposkytují. Navíc může být někdy problém s důkazem, že výsledný soubor čísel skutečně splňuje to, co od náhodných čísel čekáme. Počítačový věk přinesl revoluční posun v metodice. Náhodná čísla je možné generovat pomocí opakovaných matematických výpočtů s mnohacifernými čísly. Rychlé počítačové programy mohou v krátké době vyrobit velké množství čísel, která se chovají náhodně. Část takových generátorů

20 náhodné proměnné využívá běžné aritmetické operace sčítání a násobení a proto se jim také říká aritmetické generátory, jiné využívají další funkce (odmocniny, logaritmy, ). Zhruba v sedmdesátých letech dvacátého století byl vývoj takových generátorů úspěšným odvětvím aplikované kybernetiky. Nesmíme totiž zapomínat, že správně pracující počítač je striktně deterministické zařízení. Není schopen chovat se náhodně přinejmenším do doby než vzniknou hypoteticky očekávané kvantové počítače. Všechna čísla, která počítačový program vyprodukuje, podléhají deterministickým pravidlům. Proto se náhodným číslům, generovaným počítačem, říká pseudonáhodná čísla a proto je tak obtížné sestavit jejich generátory, jejichž výstupy by po dostatečně dlouhou dobu vypadaly náhodně. Dnes už ale existují generátory pseudonáhodných čísel, jejichž výstupy splňují i hodně náročné statistické testy náhodnosti a můžeme s nimi bez obav jako s náhodnými také počítat. Mimochodem, v kapesních kalkulačkách takové generátory obvykle zabudované nebývají a nahrazují je tam bloky už hotových pseudonáhodných čísel uložených v paměti. 5. Modulární algebry Poslední kapitola první části těchto skript si klade za cíl, seznámit čtenáře s jednou z algebraických teorii, původně nepříliš důležitou, která se dostala do ohniska zájmu v souvislosti s matematizací logiky někdy kolem poloviny devatenáctého století a velmi intenzivní pozornost si získala až u konstruktérů počítačů (a ještě dříve telefonních ústředen a ostatních reléových elektronických zařízení). Tady se s ní seznámíme proto, že se v myšlení lidí často zaměňuje za počítání s dvojkovou soustavou. Je to omyl vcelku sice lidsky pochopitelný (oboje se vyskytuje v souvislosti s počítači, v obou případech se pracuje s binární abecedou a obě připadají laikům na hony vzdálené jejich každodenní zkušenosti), my bychom si ale měli v obou udělat jasno kdyby pro nic jiného tak proto, abychom se trapně nepletli, když budeme s jejich pojmovým aparátem v budoucnu pracovat. A to jistě budeme. Nuže, v této podkapitole se dotkneme binární číselné soustavy. Více si o ní řekneme až v dalším textu (v podkapitole 7.A.4.3), to co si o ní budeme říkat tady je ale pro studenty informatiky do té míry známé, že si takové předbíhání v tématech můžeme dovolit. To, co o ní potřebujeme vědět, je celkem jednoduché jsou v ní k dispozici sice jen dvě číslice, 1 a 0, ale je s ní možné napsat jakékoli konečné číslo. Stačí jenom číslice ve správném pořadí opakovat. V tomto smyslu se dvojková soustava nijak neliší od desítkové nebo jakékoli jiné. V obvyklé algebře celých, racionálních, nebo reálných čísel vždy pracujeme s neomezeně mnoha čísly a výsledek může nabývat jakoukoli hodnotu z jejich množiny. Matematika ale umí modelovat a algebraicky popsat i jiné počítání. Při něm máme k dispozici jenom konečné (a obvykle ne moc velké) množství čísel a ať s nimi počítáme, jak počítáme, výsledek nikdy nesmí přesáhnout jejich meze. Algebrám, které takové počítání popisují, se říká modulární algebry název je odvozen od skutečnosti, že je v nich k dispozici nějaký rozsah (modul) čísel a s těmi musí počítání vystačit. V obecném podání to vypadá jako abstraktní hříčka nevalné užitečnosti, ale ve skutečnosti s alespoň jednou modální algebrou pracujeme několikrát denně a ani nám to nepřijde. Představte si obyčejné hodinky nebo hodiny s dvanácti hodinami a ručičku, která nám ukazuje čas (v této chvíli se omezíme na malou ručičku). Oproti obvyklým zvyklostem si jenom nahradíme číslo 12 číslem 0 (digitální hodinky to už udělaly za nás). Při počítání, jaký čas hodiny ukazují, musíme vystačit jen s oněmi dvanácti čísly 1 a z jejich rozsahu nevystoupíme. Na takovém hodinovém číselníku se také jinak počítá. Jistě, při sčítání (to je, při pohybu ručičkou dopředu) je 4+3=7 a 7+4=11, ale 7+5=0 nebo 7+9=4. Také odečítání (pohyb ručičkou dozadu) vypadá jinak: 8-10=10, 3-8=7 a tak dál. Takové počítání má všechny vlastnosti 1 Přiznejme si, že při otázce, jak dlouho něco trvá, už je situace jiná trvat může nějaký děj mnoho hodin, jistě i víc než jenom dvanáct ale údaj o tom, kolik je hodin má jen dvanáct možných odpovědí. Na našich hodinách to jsou 0, 1, 2,,

21 obvyklého počítání je komutativní a asociativní, existuje v něm nulový prvek (prvek, jehož přičtením nebo odečtením se nic nezmění je to prvek 0 na tradičních hodinách doma v kuchyni je na jeho místě napsáno 12) a ke každému prvku existuje i prvek opačný (pohyb ručičkou o stejný úsek, ale opačným směrem). Je také invariantní na zvolené číselné soustavě. Jistě jste si všimli (a pokud ne, všimněte si toho teď), že čísla jsou zapsána desítkovou číselnou soustavou, která má jen deset číslic a mohla by být snadno zapsána ve dvojkové soustavě, v osmičkové, dvanáctkové nebo každé jiné s nejvýše dvanácti číslicemi. Samozřejmě, totéž platí pro hodiny s číselníkem o jakémkoli konečném počtu čísel (z vlastní zkušenosti jistě známe hodiny s 24 čísly). Nic kromě stydlivosti nám nebrání považovat za aritmetickou operaci i otáčení obyčejným pokojovým vypínačem. Při ní využíváme i modulární algebru se dvěma prvky zapnuto, vypnuto. Princip modulárního počítání je v cyklickém opakování výsledků konkrétních číselných operací a teorii takového počítání formálně dotvořil slavný německý matematik Karl Friedrich Gauss už v roce Od té doby byla modulární algebra součástí algebraických pojmů a znalostí jistě zajímavou, ale ne strhující. Spíš trochu exotické cvičení v tom, co všechno se dá s algebrou také dělat. To trvalo až do poloviny devatenáctého století. Tehdy vydal (přesně v letech 1847 a 1854) anglický, nebo spíš skotský, matematik George Boole dvě knihy, ve kterých vlastně vytvořil to, čemu dnes říkáme matematická logika, s důrazem na slovo matematická. Logika a její principy byly známy už ve starověku jsou to základy cílevědomého myšlení a hledání pravdy. Pravidla a zákonitosti, kterými se logika řídí, byly formulovány už v antickém Řecku jméno Aristoteles asi slyšel každý vzdělaný člověk. Až do Boolových prací ale patřila logika spíš k filozofii, byla verbální, její pravidla se odříkávala jako slovní poučky, často hodně nepřehledné. Teprve Boole si všiml, že skládání logických výroků, které jsme si připomněli v podkapitole 1.B, je k nerozeznání podobné modální algebře s pouhými dvěma čísly. Ta čísla jsou PRAV- DA a LEŽ (v informatice spíš označované anglickými zkratkami T (True) a F (False)). Někdy jsou používány i číslice 0 a 1, nesmíme ale zapomínat, že se v tomto případě jedná pouze o grafické symboly bez číselného obsahu fungují jen jako znaky pro dvě hodnoty jedné proměnné pravdivosti výroku. S jednotlivými logickými operacemi pak Boole pracoval jako s nějakými exotickými početními operacemi na dvouprvkové modální algebře, přičemž výsledkem každé takové logické operace mohla být zase jen jedna z obou hodnot T nebo F. Příslušné tabulky, ukazující, jak jednotlivé operace logické algebry přiřazují pravdivostní hodnoty výsledkům takových logických operací jsme si také připomněli v podkapitole 3.A. Tato kapitola je tady uvedena především proto, abychom si po bližším seznámení s dvojkovou číselnou soustavou připomněli, že i když se v informatice pro logické operace používá specifická binární abeceda, nejde ani o binární kód, ani o nějakou logickou číselnou soustavu. Je to modulární algebra o pouhých dvou prvcích, tedy poměrně přehledná, a žádná z jejích operací nemůže mít výsledek vybočující z úzké množiny pouhých dvou hodnot. Příběh Boolovy logické algebry má ale ještě své pokračování. V roce 1937 obhájil jeden student Massachusettského technologického institutu, slavného MIT, diplomovou práci. Měl za úkol navrhnout zařízení, telefonní ústřednu (což v té době před vznikem počítačů bylo nejkomplikovanější elektronické, přesněji elektromechanické, zařízení, osazené mnoha relé) s poměrně pokročilými vlastnostmi, Ten student se jmenoval Claude Elvood Shannon a svou diplomku obhájil, když mu bylo 21 let. Na rozdíl od drtivé většiny svých současníků věděl o Boolově logické algebře a uvědomil si, že i ve spojích telefonní ústředny se pracuje s modulární algebrou o dvou prvcích buď spojem proud prochází, nebo neprochází a že spínače (relé) jsou něco jako logické (nebo početní) operace skládají příchozí signály/nesignály do výstupních stavů (zase výběrem ze dvou možností) a že dokonce i relé sama o sobě jsou binární zařízení mají dva stavy, vypnuto a zapnuto. Nemusel už příliš vymýšlet zákonitosti počítání v takové modulární algebře, George Boole tu

22 hlavní práci udělal před ním. Nejen že Shannon svou práci úspěšně obhájil, ale založil tím nový vědní obor, teorii konečných automatů, což je u diplomových prací událost naprosto ojedinělá. Obr. 1. C.E. Shannon a Theseus (převzato z Wikipedie) Obr. 2. C.E. Shannon v pokročilejším věku (převzato z computinghistory.org.uk) U Clauda Shannona se ještě chviličku zdržíme, zaslouží si to. O devět let později, jako pracovník Bell Telephone Laboratories, totiž vydal, spolu se svým kolegou Warenem Weaverem, odbornou stať, kterou založili další nový vědní obor teorii informace. Stali se tím, spolu s Norbertem Wienerem (kterému ve stejném roce 1948 vyšla jeho kniha Kybernetika) zakladateli kybernetiky, vědy, která změnila tvář dvacátého století asi ještě víc než atomová energie. Aby to nebylo všechno, reagoval na diskuse o možnosti umělé inteligence tím, že v padesátých letech sestrojil první učící se zařízení, známou Shannonovu myš 2. Někteří historici vědy označují Clauda Shannona za patrně nejgeniálnější mozek dvacátého století. Pomineme-li to, že inteligenci nelze dost dobře řadit do žebříčků nesporně je pravda, že Shannon skutečně byl jednou z největších a přitom úžasně neokázalých osobností intelektuálního snažení 20. století. Tato skripta jsou, ve své převážné části, o jeho práci, tak si tuto připomínku zasloužil. 2 Byl to vozíček napojený na počítač, který namátkou hledal cestu bludištěm k určenému cíli, a když ji našel, zapamatoval si ji a při příštím pokusu už jel najisto. Shannon svému vozíčku říkal Theseus podle hrdiny pověsti o krétském labyrintu a Minotaurovi

23 Část II: Informace a její zdroj Teorie informace se zabývá především vznikem zpráv, jejich informačním přínosem a zákonitostmi jejich přenosu sdělovacími kanály. V této části předloženého textu se soustředíme na první složku celého tohoto procesu, na matematický model zdroje informace a jeho vlastnosti. Budeme se zabývat měřením velikosti informace, která je zdrojem produkována a téma rozšíříme o některé typy zdrojů nebo abeced, se kterými se v praxi nejčastěji setkáváme. Přenosovými kanály, jejich kapacitou a jejich schopností přenášet informaci pocházející z konkrétního zdroje, se budeme zabývat v následující, třetí, části těchto skript. Informace je těsně svázána s pojmem nejistoty. V jistém smyslu je jejím protějškem. Moderní matematika zná několik typů nejistoty, my se z nich soustředíme na jediný, na náhodnost popsanou pravděpodobností. 6. Co je informace? Na první pohled by se mohlo zdát, že se pojem informace poněkud vymyká objektivnímu popisu a měření. Je to něco, čemu teprve lidské myšlení a lidská schopnost získávat a využívat znalosti, dává smysl a díky tomu by se mělo na informaci pohlížet jako na něco zcela subjektivního. Ve skutečnosti tomu tak není. Informace je jiné jméno pro znalosti, případně pro záznam oněch znalostí, a i v běžné každodenní mluvě jsme zvyklí mluvit o nových a starých znalostech, o učení jako nabývání znalostí, o získávání a hromadění znalostí a informací, že někdo má více znalostí, nebo že něčí znalosti jsou kvalitnější, přesnější, obecnější, hlubší. To všechno jsou pojmy a vlastnosti, které mají objektivní smysl a jsou měřitelné. Z tohoto hlediska také budeme k informaci přistupovat. Takže: Informace jsou znalosti ukládané a přenášené v rámci poznávání světa. Obojí, znalosti i informace, znamenají snížení nejistoty o okolním světě ve prospěch organizovanosti a systematičnosti našich znalostí o něm. Na rozdíl od jiných tvorů si své znalosti uvědomujeme jako něco, co existuje i mimo naši subjektivitu, jako něco objektivního. Nicméně, i jako objektivně existující jev se informace dost vymykají vlastnostem, které obvykle existujícím reálným objektům přisuzujeme. Například: Používáním se hodnota informace nesnižuje, ale většinou spíš roste (informace se zpřesňuje). Předáváním informace jinému uživateli se informace pro prvního nositele neztrácí. Informaci lze zvýšit pouze jejím získáváním z vnějšího zdroje. Sama o sobě se bez vnějšího obohacení nezvyšuje, pouze je možno ji přeorganizovat a učinit srozumitelnější. Právě popsané vlastnosti jsou celkem samozřejmým důsledkem toho, že informace není hmotný objekt, ale struktura, do které jsou hmotné objekty a jejich obrazy uspořádány. To je typická vlastnost matematiky a není proto divu, že teorie informace a teoretická informatika vůbec patří mezi disciplíny studované metodami matematických věd. V předchozích odstavcích jsme informaci charakterizovali jako snižování nejistoty. Tím jsme uvedli důležitý pojem, na který se budeme v následujících kapitolách dost často odvolávat a o kterém jsme si toho zatím moc neřekli. V této chvíli se s ním seznámíme jenom heuristicky, to znamená slovním, spíš intuitivním popisem jeho vlastností nebo chování. Přesný popis jednotlivých typů nejistoty si necháme na mnohem později. Zatím tedy stručná charakteristika těch typů nejistoty, kterými se dnešní informatika zabývá. Nejistota se stala předmětem zájmu matematiky teprve poměrně nedávno. Dlouho se lidé domnívali, že nejistota je už svou podstatou neuchopitelná metodami přesné matematiky a logiky

24 založené na jistotě. Že je spíš výsledkem působení nevlídně naladěných nadpřirozených sil, ďábla, zlých duchů, zakletých předků nebo animistických příšerek, které si tak s lidmi vyřizují dávné účty nebo nedostatek hodnotných obětí na oltářích. Péče o nejistotu pak spadala do kompetence náboženství, duchařiny, nebo okultních věd. První typ nejistoty, kterým se matematika vážně zabývala, byla náhoda a nástroj, který pro to matematici vytvořili, byl počet (později teorie) pravděpodobnosti. Náhoda bývá někdy interpretována jako projev nedostatečné znalosti zákonitostí a pravidel, kterými se běh věcí řídí (i když moderní fyzika na to má i trochu jiný názor). Poměrně brzy si lidé uvědomovali také existenci nepřesnosti, i když ji většinou nepovažovali za samostatný typ nejistoty, ale za určitý typ dat. Pro práci s nepřesnými daty se často používá tak zvaný intervalový počet, někdy bývají prezentována jako náhodná a na jejich zvládnutí se užívá počet pravděpodobnosti. Až po polovině dvacátého století byl pojmenován a matematicky formalizován další typ nejistoty, nazvaný vágnost. Matematici si jeho existenci uvědomili až v souvislosti s kvalitativně novými aplikacemi, které umožnil rozvoj výpočetní techniky. Začala se objevovat data, která nebyla náhodná, ale přesto nebyla přesná. Neměla totiž spolehlivý, jednoznačný výklad. Na jejich zpracování byla vyvinuta teorie fuzzy množin. Poslední zatím navržený typ nejistoty nemá ustálený název. Jako nejvhodnější se jeví granulace, a modelován je pomocí zcela originální modifikace teorie množin, nazývané hrubé množiny. Jedná se dosud o spíš teoretický model než o prakticky aplikovanou metodu. Podstata tohoto typu nejistoty je v tom, že nepřesně známé jevy nepopisuje pomocí množin jednotlivých bodů, ale speciálními třídami množin. V dalších kapitolách tohoto dílu se budeme zabývat výlučně náhodou, popsanou prostřednictvím teorie pravděpodobnosti a klasickou teorií informace, která je na ní postavena. 7. Zdroj informace Jedním ze základních pojmů teorie informace je zdroj, ze kterého informace vychází. V podstatě je to cokoli, v čem informace vzniká a odkud je přenášena dál. Po technické stránce je realizován mnoha různými způsoby, od lidského hlasu, přes přírodní zvuky, signály typu dopravních značek nebo nášivek na prádle s pokyny pro jeho praní, až po rozmanitá technická zařízení včetně sofistikovaných automatických přístrojů nebo monitorovacích zařízení. V následujících podkapitolách a kapitolách proto věnujeme zdroji informace velkou pozornost. Pro tuto chvíli, a abychom vůbec tušili, jakým směrem se naše úvahy a zájem budou rozvíjet, si jen povšechně řekněme, že zdroj informace je, pro teorii informace, vcelku jednoduchá struktura a nic na tom nemění případná technologická komplikovanost její praktické realizace. Zdroj informace budeme chápat jako dvojici, složenou z abecedy a nějakého mechanismu, který z ní vybírá jednotlivé znaky a postupně z nich skládá zprávu. Znakům a zprávám sestaveným z abecedy zdroje informace někdy souhrnně říkáme data. A to je pro tuto chvíli vše. Další podkapitoly nám ukáží, že to vše může pokrývat docela široký okruh zájmů. 7.A Nositelé informace - data Časem se dočteme o tom, že informace je poměrně abstraktní, matematicky formulovaný pojem, zkoumaný odděleně od svého vnímatelného nosiče dat. Ani to slovo vnímatelný nesmíme chápat příliš dogmaticky. I číslo, znak abecedy, elektrický signál, bliknutí světla a řada dalších jevů, ve kterých jsou informace nějak zapsány, má většinou dost abstraktní povahu. Jsou ale přeci jenom více spojeny s realitou nebo nesou informaci, která v nějaké realitě vznikla

25 V této kapitole se budeme přehledově zabývat různými typy dat a těmi základními pojmy, které charakterizují to, čemu říkáme zprávy a zdroje zpráv. I přes značnou jednoduchost, se kterou jsou pojmy a jejich vlastnosti předkládány, je tato kapitola důležitá. Mimo jiné i proto, že terminologie pro tvorbu a přenos zpráv zatím není obecně zažitá a je dobře si vyjasnit, co jednotlivá slova a pojmy zajímají. V následujících podkapitolách se seznámíme s některými typy abeced, podrobněji se zastavíme u nedekadických číselných soustav, vyjasníme pojmy signál a zpráva, definujeme si, co v teorii informace znamenají slova zdroj zpráv a hodně stručně se seznámíme s historií šifer. 7.A.1 Abecedy Pod slovem abeceda rozumíme v teorii informace něco poněkud obecnějšího, než v běžném jazyce, zásadní rozdíl ale nevzniká. V podstatě jím označujeme každý soubor znaků, ze kterých sestavujeme zprávu. Soubor grafických znaků (to, čemu v běžném jazyce říkáme abeceda, doplněná o číslice, interpunkční značky a další dohodnuté symboly, například matematické), soubor tónů nebo složitějších zvuků, které nesou nějaký dohodnutý význam, polohy praporků při signalizaci, elektrické impulsy. Za povšimnutí stojí slova které nesou nějaký dohodnutý význam, použitá v předchozí větě bez nějakého dohodnutého čtení znaků abecedy by z ní nebylo možné sestavit zprávu. Tady se dostáváme k první dvojici pojmů, mezi kterými je užitečné rozlišovat. Ten znak abecedy, kterému v běžném životě říkáme písmeno sice má předem dohodnutý význam ale sám o sobě ještě obvykle netvoří zprávu. Dokonce, řada týchž písmen, jenom jinak uspořádaná, může nést úplně jinou zprávu, nebo také nemusí nést zprávu žádnou (vzpomeňte si na dětskou hříčku s písmeny: KABÁT, TABÁK, a třeba nesmyslné BÁTKA). To se týká běžné komunikace, obvykle v nějakém přirozeném jazyce, případně komunikace převedené do nějakých dohodnutých šifer, ale pořád ještě obsahující přirozený jazyk. V takovém případě se pravidla, podle kterých se kombinují znaky abecedy do srozumitelných slov, stávají jednou ze složek zdroje. Později, až si předvedeme matematický model zdroje informací, budeme schopni tato pravidla přesně popsat pomocí pravděpodobností. Pravidla, podle kterých se znaky abecedy řadí do slov nebo do posloupností slov, vět, se obvykle nazývají mluvnicí daného jazyka (v oblasti informatiky se spíše používá pojem gramatika). Existují ale i jiné abecedy, jejichž každý znak už sám o sobě je hotovou zprávou. Také je znáte seznam dopravních značek, symbolů pro prádelnu, různé piktogramy (,, ), některé matematické symboly (,,,, ), svým způsobem i turistické značky, barvy světlic při vojenských nebo námořních akcích, signální praporky na lodích a jistě ještě mnohé další. Také ony tvoří abecedu, pro odlišení se jim ale neříká písmena, nýbrž signály a rozlišovací vlastností mezi nimi a písmeny je to, že (neformálně řečeno) většinou nemají svou mluvnici seřazením několika signálů za sebou nevznikne nic kvalitativně nového (například slovo, nebo věta), co by neslo novou informaci, ze samostatně registrovaných jednotlivých znaků nezjistitelnou podle dalších dohodnutých pravidel. Sled signálů nám předá jenom souhrn sdělení, která nese každý signál zvlášť. Stručně řečeno, ani celá alej dopravních značek nebude vyprávět anekdotu (i když to někdy na pokus o něco podobného vypadá). Když bývalo (a někdy dosud je) na námořní lodi vyvěšeno několik signálních praporků, nepatřilo to k vlajkoslávě, ale bylo to několik nezávislých sdělení oznamovaných současně třeba Čekám na lodivoda a Infekční nemoc na palubě. Abeceda se na první pohled zdá být poměrně jednoduchý pojem a v podstatě taková také je. Přesto se na něm dají dobře ukázat některé jevy, které mají obecnější povahu a každý, kdo chce vědět, co vlastně dělá, když se zabývá informacemi, by měl mít o těchto jevech alespoň základní představu. My se soustředíme na tři z nich. Na obecný pojem kódování a na specifické typy kódů Morseovu abecedu a číselné soustavy. 7.A.2 Kódy V běžném vyjadřování se lidem obvykle trochu pletou slova kód a šifra. Obojí považují za způsob utajení nějakého textu tím, že bude převeden na nějaký nesrozumitelný tvar. V teorii informace je ale mezi obojím určitý rozdíl, hlavně v účelu, pro který se kódování nebo šifrování provádí

26 Šifra je převedení textu na jiný buď změnou pořadí znaků, nebo náhradou každého znaku či skupiny znaků jiným znakem (nebo konečnou posloupností znaků dvojicí, trojicí a podobně) podle dohodnutého klíče. Přitom mohou, ale nemusí být oba texty, původní i šifrovaný, napsány ve stejné abecedě. Účelem je znemožnit (ve skutečnosti obvykle spíš znesnadnit) porozumění původní zprávě každému nezasvěcenému příjemci (který nezná klíč šifry). Kód je nahrazení jedné abecedy (obvykle se jí říká abeceda zdroje), jinou abecedou (říkává se jí kódová abeceda někdy také přenosová abeceda) a účelem je hlavně usnadnit technickou stránku záznamu, zpracování nebo přenosu zprávy. Zpráva psaná rukou na papír se pro přenos radiovými pojítky zakóduje do úseků elektromagnetických vln, čísla v dekadické soustavě se zakódují do binární, nápis v sumerském klínovém písmu se přepíše do nějaké moderní abecedy. Obecněji řečeno, každý znak (popřípadě skupina znaků abecedy zdroje (zdrojové slovo) se nahradí znakem nebo skupinou znaků (kódovým slovem) ve znacích kódové abecedy. Nejčastějším zdrojem záměn mezi kódováním a šifrováním bývá to, že i kód může být, čistě graficky, napsán ve znacích stejné abecedy jako původní zpráva (například číslo v binárním kódu je zapsáno stejnými znaky 0 a 1, které se vyskytují v běžném dekadickém číselném systému - a naopak, při převodu binárního čísla na dekadické se částečně děje totéž), jen se vyskytují v trochu jiných souvislostech (v jistém smyslu se čtou jinak). My se v této kapitole soustředíme na kódování a jeho vlastnosti. Důležitá je pro nás hlavně jedna z nich kódování by nám nemělo zbytečně komplikovat život nebo zatěžovat zařízení. Řečeno o něco kulantněji, kódovaná zpráva by neměla být o moc delší, než bezprostředně musí. Pokud nejsou kódová slova stejně dlouhá, měly by být znaky (slova) abecedy zdroje, které se vyskytují častěji, kódovány kratšími kódovými slovy než ty, které se vyskytnou jen zřídka. Ještě si o tom, v závěrečných odstavcích této podkapitoly, povíme víc. Pokud je kód definován tak, aby byla všechna kódová slova stejně dlouhá, třeba délky n, neměla by být delší než je bezprostředně nutné. Ne pokaždé se to podaří absolutně, někdy prostě je příslušných n-tic znaků kódové abecedy k dispozici víc než kolik je potřeba zakódovat znaků (nebo kódovaných skupin znaků), ale ani v takovém případě nebývá rozumné volit pro kódová slova zbytečně delší. To bychom si měli ukázat na příkladu. Příklad 7.1. Představme si, že chceme text (řekněme číselná data), zaznamenaný v obvyklé dekadické soustavě, zakódovat do abecedy o dvou znacích třeba a (záměrně jsme zvolili symboly, které nepřipomínají binární číselnou soustavu). Předpokládejme dále, že budeme čísla v dekadické soustavě kódovat nikoli jako celek, ale cifru po cifře. Pokud se rozhodneme pro kód s nestejně dlouhými kódovými slovy, můžeme, například, kódovat jednotlivé cifry takto: 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =. Při tom, co v této chvíli víme, nemůžeme rozhodnout, zda je kódování výhodné, či zda by ho šlo upravit tak, aby zprávy, posílané v takové kódové abecedě {,é}, vyšly kratší. Pokud bychom věděli (například na základě statistických šetření), že když číslice v původních zprávách seřadíme podle četnosti jejich výskytu, vyjde nám pořadí od nejčastější k nejméně časté 8, 5, 0, 2, 9, 3, 4, 1, 7, 6, bude výhodnější kódovat jednotlivé dekadické číslice takto: 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =. Řekněme ale, že jsme technickými podmínkami nuceni kódovat všechny číslice stejně dlouhými kódovými slovy. Jak mají být dlouhá? Jistě nestačí dvoumístná, při kódové abecedě o dvou znacích

27 nám dvě místa stačí jen na čtyři kódová slova:,, a. Podobně ani třímístná slova nebudou stačit je jich jen osm a my potřebujeme deset kódových slov. Nezbývá než se uchýlit ke kódovým slovům, která mají čtyři (nebo víc) znaků. Víc než čtyři znaky by bylo plýtváním kapacitou přenosových nebo záznamových zařízení (pokud by pro jejich užití nebyly jiné důvody), takže budeme muset užít kódová slova o čtyřech znacích. Pro úplnost, jsou to,,,,,,,,,,,,,,,, a my vidíme, že pro šest takových slov nemáme použití, i když je zavést musíme deset potřebných kódových slov s pouhými dvěma znaky abecedy jinak dohromady nedáme. Příklad 7.2. Vraťme se ještě jednou k předchozímu příkladu, přesněji k té jeho části, která se týká kódu o nestejné délce kódových slov. Máme tedy k dispozici abecedu zdroje {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} a kódovou abecedu o dvou znacích {, }. Oproti předchozímu příkladu budeme předpokládat, že známe pravděpodobnosti (to znamená také pravděpodobné četnosti) výskytu znaků abecedy zdroje: P(0) = 0,16, P(1) = 0,04, P(2) = 0,12, P(3) = 0,06, P(4) = 0,05, P(5) = 0,20, P(6) = 0,01, P(7) = 0,02, P(8) = 0,25, P(9) = 0,09, (hodnoty pravděpodobnosti odpovídají pořadí výskytu znaků 8, 5, 0, 2, 9, 3, 4, 1, 7, 6, uvedenému v předchozím případě). Pokud zvolíme kódování bez ohledu na četnosti znaků abecedy zdroje, například 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =, bude průměrná délka kódového slova rovna 2,76. Jestliže ale použijeme kódování, které bere ohled na četnost znaků, 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =, vyjde nám průměrná délka kódového slova jenom 1,67, tedy méně než 2/3 (přesněji, 60,5%) původní potřebné délky. Při kódování dlouhých zpráv to je významná úspora přenosového času. Pro úplnost, zvolíme-li kódování o stejné délce kódových slov, víme už, že jejich délka musí být nejméně 4 znaky a průměrná délka kódového slova bude, přirozeně, také 4,00. Povšimnutí si zaslouží jedna skutečnost procento zbytečných kódových slov kolísá a dosti často (i když ne vždy) klesá, jestliže abecedu zdroje kódujeme ne po jednotlivých znacích, ale po (zpravidla krátkých) konečných skupinách. Abychom se po delší přestávce vrátili k řeči symbolů je třeba si uvědomit, že kódováním celých slov délky m jsme vlastně původní abecedu A nahradili novou abecedou A m, kde A m = A A A je m-násobný kartézský součin abecedy A. Předpokládejme dále, že zprávy zapsané v abecedě A kódujeme do zpráv v symbolech nějaké abecedy B. Kódování formálně znamená, že každému slovu o m znacích z abecedy A jednoznačně přiřadíme nějaké kódové slovo o n znacích z abecedy B. Jinými slovy, každému prvku (x 1,, x m ) A m přiřadíme jeden prvek (y 1,, y n ) B n. Samozřejmě, že množina B n musí mít alespoň tolik prvků, jako množina A m, jinak by jednoznačné kódování nebylo možné. Abychom mohli dobře porovnávat, jaký podíl kódových slov je při použití kódu se stejně dlouhými kódovými slovy navíc, zavedeme, pouze pro účel této kapitoly, jednoduchý koeficient, který nazveme koeficientem nadbytečnosti kódu. Označíme ho K(A m, B n ) a definujeme ho jako zlomek (symbol #(M) značí jako obvykle počet prvků množiny M),

28 K(A m, B n ) = [#( B n ) ー #( A m )] / #( B n ). V následujících poznámkách a příkladu se zamyslíme nad chováním koeficientu nadbytečnosti. Poznámka 7.3. Je zřejmé, že pokud by počet kódových slov nestačil pro všechna slova zdrojové abecedy, byl by koeficient nadbytečnosti kódu záporný, ale především by jednoznačné kódování bylo nemožné. Proto je vždy nutné, aby pro dané m byla délka kódových slov n taková, aby Poznámka 7.4. Je velmi snadné ověřit, že #( B n ) #( A m ). #( A m ) = (#A) m a #( B n ) = (#B) n. Poznámka 7.5. S rostoucí hodnotou m musí růst i hodnota n (aby počet kódových slov stačil na kódování všech slov abecedy zdroje o délce m). Předchozí poznámky můžeme ilustrovat na následujícím příkladu. Příklad 7.7. Předpokládáme, že je třeba pomocí kódové abecedy B={b 1, b 2 } o dvou znacích kódovat zprávy tvořené zdrojem s abecedou A= {a 0, a 1, a 2,, a 9 } o deseti znacích a že jsme nuceni použít kódová slova o stejné délce. (Podobné kódování bylo popsáno v předchozích příkladech). Začneme případem, kdy budeme kódovat každý znak abecedy A zvlášť. Z Příkladu 1 víme, že potřebujeme kódová slova o alespoň čtyřech znacích. A že takových slov je 16, zatímco jednoznakových slov abecedy zdroje je 10. V symbolech, které jsme použili výše, m=1, n=4, #A = 10, #B = 2, #( A m ) = 10, #( B n ) = 16, takže K(A m, B n ) = 6/16 = 0,375. Když se rozhodneme kódovat slova o dvou znacích abecedy A (takových slov je 100), není těžké ověřit, že potřebujeme kódová slova o alespoň 7 znacích kódové abecedy B (je jich 128, zatímco slov o 6 znacích je pouze 64 a to ještě nestačí) a pak to znamená, že m=2, n=7, #A = 10, #B = 2, #( A m ) = 100, #( B n ) = 128, takže K(A m, B n ) = 28/128 = 0,219. Při kódování slov o třech znacích abecedy A, potřebujeme k tomu kódová slova o 10 znacích abecedy B (je jich 1024) a hodnoty, ze kterých počítáme koeficient nadbytečnosti, jsou m=3, n=10, #A =10, #B= 2, #( A m ) =1000, #( B n ) =1024, takže K(A m, B n ) = 24/1024 = 0,023. Pro slova o čtyřech znacích ale koeficient úspornosti zase dočasně vzroste. m=4, n=14, #A =10, #B= 2, #( A m ) =10 000, #( B n ) =16 384, takže K(A m, B n ) = 6384/16384 = 0,390, zatímco pro kódování slov o pěti znacích m=5, n=17, #A =10, #B=2, #( A m ) = , #( B n ) = , K(A m, B n ) = 31072/ = 0,237. Zatím jsme se zabývali charakteristikou nadbytečnosti kódů se stejnou délkou kódových slov a kódům s nestejně dlouhými kódovými slovy jsme věnovali jen kratičkou poznámku. Týkala se toho, že jejich nadbytečnost nebo naopak úspornost záleží na pravděpodobnostech, se kterými se ve zprávách vyskytují různé znaky kódované abecedy. Pokud studujeme kódy, které se používají pro kódování poměrně stabilních a dlouhodobých zdrojů zpráv (pravidelný odečet meteorologických nebo technických dat, každodenní pravidelné hlášení o průběhu nějakých prací a podobně), nebývá problém takové pravděpodobnosti statisticky zjistit. Předpokládejme tedy, že pro nějakou abecedu A známe pro každý její znak a A pravděpodobnost p(a), se kterou se ve zprávách produkovaných příslušným zdrojem vyskytne. Předpokládejme dále, že jsou znaky abecedy A kódovány do konečných posloupností (slov) znaků nějaké kódové abecedy B, pro každý znak a A si označíme příslušné kódové slovo zkratkou b(a) = (b 1,, b k )

29 a jeho délku označíme δ(a). V daném případě je δ(a)=k. Pak můžeme měřit úspornost kódu tím, že spočítáme průměrnou délku kódového slova a porovnáme ji s průměrnou délkou kódového slova v případě, že by všechny kódové znaky abecedy A byly stejně pravděpodobné. Průměrnou délku kódového slova označíme (A,B) = a A p(a).δ(a) A v případě, že jsou všechny znaky abecedy A stejně pravděpodobné (znamená to, že abeceda A má N znaků) označíme *(A,B) = (1/N). a A δ(a). Poznámka 7.8. Uvedený vzorec je možné použít i v případě kódů se stejnou délkou kódových slov (to znamená takových, že pro každý znak a A je δ(a)=δ ). Je zřejmé, že pak musí být (A,B)=δ při každém rozložení pravděpodobností na abecedě A. Jako vhodná míra úspornosti kódu může sloužit například poměr: (A,B) / *(A,B). Čím je hodnota tohoto zlomku nižší (pro stejné abecedy A a B a stejné rozložení pravděpodobnosti p(a)) nižší, tím je kód úspornější. Příklad 7.9. Připomeňme si Příklad 7.2. Použijeme-li numerické výsledky, které v něm byly získány a značení, které jsme právě použili, vyjde nám pro kódování 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =. (A,B) = 2,76 a *(A,B) = 2,6, takže míra úspornosti kódu je 1,062. Použijeme-li v témže příkladu kódování respektující četnost znaků, 0 =, 1 =, 2 =, 3 =, 4 =, 5 =, 6 =, 7 =, 8 =, 9 =. Vyjde nám (A,B) = 1,67 a *(A,B) = 2,2, takže míra úspornosti kódu je 0, A.3 Morseova abeceda Poměrně známým příkladem kódové abecedy pro kódování alfanumerických textů je Morseova abeceda. Pro stručnost si ji označme M a podívejme se na její vlastnost z hlediska toho, co jsme si o kódování obecně řekli v předchozí podkapitole. Mohlo by se zdát, že její slávě už odzvonilo a tak trochu na tom něco je. Kromě skautíků a vojenských radistů už ji moc lidí nepoužívá. Dokonce už byla vyřazena z používání v mezinárodní námořní plavbě (bylo to v roce 1999, ve francouzském loďstvu dokonce o dva roky dřív). Přesto žije a dokonce k ní přibývají nové kódové skupiny znaků. Naposled to bylo v roce 2004, kdy světová telekomunikační unie přijala jako nejnovější znak morseovky sled teček a čárek pro Je to (vnímavější znalci morseovky si možná všimli, že to jsou vlastně slepené znaky pro ac, kde c symbolicky nahrazuje onen obal kolem a, který je pro zavináč typický). Přesto bychom se měli Morseově abecedě M chvíli věnovat zaslouží si to. Pan Samuel Finley Breese Morse ( ), který ji navrhl, jí věnoval hodně úsilí a vložil do ní technické (a hlavně informatické) principy, které se uplatňují dodnes. Povoláním byl Samuel Morse malíř (na internetu se dá najít i několik jeho obrazů rozvěšených v amerických galeriích), přesto prokázal nečekanou

30 technickou intuici. Jeho abeceda rozhodně nebyla jen momentální nápad, který by jeden den načrtl na papír a druhý den s ním zašel na patentový úřad. Svou myšlenku zdokonaloval od roku 1832 a o patent požádal až v roce Nesestavil jenom abecedu, ale sestrojil také zařízení pro snadné vysílání teček a čárek (Morseúv klíč) a pro jejich příjem. Upravil a zdokonalil i vybavení pro přenosové trasy, různé zesilovače signálu a napáječe, takže mohl v roce 1844 otevřít první vlastní telegrafní linku mezi Baltimoorem a Washingtonem (byla 51 mil, tedy zhruba 84 km, dlouhá) 3. Důležitější ale je to, že si Morse uvědomil existenci pojmu úspornosti kódu, a velmi vtipně se o úspornost své abecedy snažil. Než si o tom řekneme víc, měli bychom uvést na pravou míru jeden poměrně rozšířený omyl. Mnoho lidí si myslí a mnozí autoři to i píší, že abeceda M je binární že má jen dva znaky: tečku ( ) a čárku ( ). Není to ale pravda. Morseova abeceda je ve skutečnosti ternární, to znamená, že užívá tři znaky. Nejen tečku a čárku, ale také mezeru mezi kódovými slovy ( ). Po tom, co jsme si už o kódech řekli, je pro nás zajímavé, že morseovka používá různě dlouhá kódová slova a prázdný znak využívá při rozlišování jednotlivých kódových slov. Jinak by bylo možné číst každý text v morseovce bez mezer jako sled hlásek e a t. To by jistě bylo případnému čtenáři nápadné, ale i v dnešní podobě morseovky je možné číst delší kódová slova pro speciální symboly jako různé dvojice slepených hlásek. Když se podrobněji podíváte na Tabulku 9 (Kódová slova Morseovy abecedy pro ostatní symboly a číslice), snadno si ověříte, že dokonce i už zmíněné kódové slovo pro se dá interpretovat jako slepená kódová slova pro ac (my už víme, že to je správný výklad), nebo pro pn případně pro wr, a takových dvojic se najde ještě mnohem víc. Dodejme ještě pro úplnost, že některé učebnice morseovky o ní píší jako o kódu se čtyřmi symboly (tečkou, čárkou, mezerou mezi kódovými slovy - tedy písmeny zdrojové abecedy - a dlouhou mezerou jako kódového označení mezery mezi slovy původní kódované zprávy). Je pravda, že mezera mezi slovy v běžném jazyce hraje roli a její ignorování může ve zlomyslně vybraných příkladech způsobit nedorozumění (jedno z nich se dostalo i do legendární věštby delfského Orakula, známé z antických pověstí; vzpomínáte? Vrátíš se z války ne zahyneš.). Přesto je označení mezery mezi skupinami kódových slov, které odpovídají slovům v abecedě zdroje nadbytečný luxus. Stačí abeceda s tečkou, čárkou a mezerou a s tím, že mezera mezi slovy původní alfanumerické abecedy se kóduje slovem složeným ze dvou nebo tří mezer. Morseovka pro čísla a méně obvyklé symboly znak kód znak kód znak kód znak kód 1 9, apostrof 2 0 : + 3 CH ; ー 4 Ä? / 5 Ö! _ 6 Ü = $ 7 É ( & 8 ㆍ Tabulka 7: Kódová slova Morseovy abecedy pro ostatní symboly a číslice 3 Pro zajímavost. První skutečně fungující telegrafní linku na delší než laboratorní vzdálenost sestrojili Karl Friedrich Gauss a Wilhelm Weber v roce 1833, tedy před Morsem a samozřejmě v ní nepoužili jeho abecedu. Poslali (a přijali!) zprávu na vzdálenost 5000 stop (asi 1700 m). Mimochodem, Weber byl profesor fyziky na göttingenské universitě a Gauss byl na téže univerzitě profesorem matematiky (a ředitelem hvězdárny) jeden z nejslavnějších matematiků v dějinách, jehož jméno studenti matematiky potkávají ve všech oborech klasické vyšší matematiky. Pak že jsou teoretičtí matematici nepraktičtí

31 To, že Morseova abeceda M není binární ještě neznamená, že binární kódy jsou vzácné. Konec konců, původní počítačové kódy binární jsou. Také pro přenos zpráv Morseovou telegrafií z teček a čárek byla vyvinuta modifikace kódu M, která skutečně binární je a k tečkám a čárkám už mezeru nepotřebuje. Je to upravená Morseova abeceda, my si ji označíme M*, má dva znaky {, } a kódování v ní vypadá tak, že původní text zakódovaný do obvyklé morseovky M ještě jednou zakódujeme, znak po znaku (tedy, aby nedošlo k omylu, zakódujeme tečky, čárky a mezery) do nového kódu M* podle předpisu: místo napíšeme, místo napíšeme, místo mezery napíšeme Binární kód M* dokonce počítá i s tím, že byl v původním kódu M použit i znak pro mezeru mezi slovy, o kterém jsme se už zmiňovali, a má pro ni své kódové slovo, místo mezery mezi slovy se píše Poznámka Intuitivně se dá čekat (a formálně dokázat), že text zakódovaný kódovou abecedou s menším počtem znaků zabere víc místa (bude se skládat z více znaků) než text zakódovaný kódovou abecedou s více znaky. Předchozí poznámku můžeme ilustrovat na zakódování krátkého slova. Příklad Pro ilustraci zakódujeme pomocí kódů M a M* slovo, které v latinské abecedě zní ano. V běžném Morseově kódu je jeho přepis následující:, zatímco v binárním kódu M* vyjde kódový přepis o dost delší:, takže začíná být jasné, proč informatici raději zapisují binární kódy pomocí číslic 0 a 1 než tečkami a čárkami. I tak vyjde předchozí ano poměrně objemné. Když píšeme místo tečky 1 a místo čárky 0, bude vypadat takto morse hláska morse hláska morse hláska morse hláska mezera 0, R 0, U 0, V 0,008. E 0, S 0, M 0, K 0,003 - T 0, H 0, P 0, X 0, O 0, D 0, Y 0, J 0, A 0, L 0, W 0, Q 0, N 0, C 0, G 0, Z 0,001.. I 0, F 0, B 0,012 Tabulka 8: Relativní četnosti (pravděpodobnosti) písmen v angličtině Tím jsme si vysvětlili, jak je to s binaritou Morseovy abecedy a konečně se dostáváme k tomu, co nás na ní zajímá nejvíc. Už ve své době, v polovině devatenáctého století, když pracoval na telegrafní abecedě, si Samuel Morse uvědomil, jak důležité bude při pravidelném (a hustém) provozu to, čemu dnes říkáme úspornost kódu. Běžným zdravým rozumem došel k tomu, že písmena, která se v anglické abecedě vyskytují nejčastěji 4, by měla být kódována nejkratšími kódovými slovy. Narážel při tom na nedostatek statistických údajů o četnosti jednotlivých hlásek v angličtině a poradil si docela důvtipně. 4 Angličtina byla přirozený jazyk pro komunikační prostředí, pro které svůj vynález tvořil

32 V knihách o historii telekomunikací se traduje, že Morseův švagr byl tiskař. Ti tehdy sestavovali sazby z jednotlivých liter, které měli uložené v krabicích rozdělených na oddělení (v češtině se jim říkalo kasy). Zkušení tiskaři měli odděleníčka v kasách různé velikosti, podle toho, jak často různá písmena potřebovali. Jejich kvalifikovaná zkušenost nahradila statistické výzkumy a zdá se, že dobře. V Tabulce 8 jsou uvedena písmena anglické abecedy s jejich relativními četnostmi a pro zajímavost je u každého také jemu odpovídající kódové slovo Morseovy abecedy M. Tabulka je seřazena od nejčastějších znaků písmen anglické abecedy k nejméně častým. Je dobře patrné, že Morse skutečně přiřazoval kratší kódová slova častějším znakům anglické abecedy (zachovalo se dokonce grafické schéma, do kterého tečky a čárky dosazoval). Je ale také pravda, že při bližším pohledu najdeme některé výjimky z pravidla. Nápadné je poměrně časté o, které je spojeno s kódovým slovem o třech znacích, a naopak m, jehož kódové slovo je kratší než by odpovídalo četnosti. Skoro to svádí k domněnce, že švagr měl v kase trochu nepořádek a přehodil oddělení pro m a o. Když spočítáme průměrnou délku kódového slova pro Morseův kód (A,M), kde jsme A označili anglickou abecedu, dostaneme hodnotu (A,M) = 1,926 (mezeru jsme považovali za znak s kódovým slovem nulové délky). Normalizovaná průměrná délka kódového slova *(A,M) (pokud jsou všechny znaky včetně mezery stejně časté), vychází rovna takže podíl obou průměrných délek je *(A,M) = 3,037, (A,M) / *(A,M) = 0,634. Pro srovnání jsou v Tabulce 9 uvedeny relativní četnosti hlásek české abecedy, tak jak byly zjištěny pro české texty. Zkusíme si pro ně spočítat podobné charakteristiky, nesmíme ale zapomenout na to, že česká abeceda má víc hlásek než anglická (i s mezerou jich je 41 proti 27 anglickým) a to už samo o sobě snižuje četnosti jednotlivých hlásek. Z Tabulky 9, která je také uspořádána podle četností hlásek) snadno zjistíme, že se pořadí hlásek v obou tabulkách liší. Mezera a e sice jsou na prvních místech, ale pak už se pořadí dost mění. Dodejme ještě, že jsme při výpočtu pro české hlásky, které nejsou v anglické abecedě, použili délku kódových slov podle Tabulky 7 (pro hlásku ch) a délky kódových slov pro nejbližší znaky anglické abecedy (pro písmena bez háčků a čárek), což odpovídá praxi běžného telegrafického provozu. Nuže, průměrná délka kódového slova Morseovy abecedy pro české texty, označíme ji (Č,M), je (Č,M) = 2,243, a v případě, že by byly všechny znaky češtiny stejně časté, byla by průměrná délka kódového slova *(Č,M) = 2,951. To znamená, že poměr obou průměrných délek je (Č,M) / *(Č,M) = 0,760. Jinými slovy, Samuel Morse opravdu nešil svou abecedu na míru češtině, ale vcelku není rozdíl zas až tak moc drastický. Zásluhu na tom má fakt, že se v evropských jazycích četnostní poměry znaků (navzdory odchylkám) nějak zásadně neliší

33 hláska hláska hláska hláska hláska mezera 0,163 I 0,034 Á 0,021 Ž 0,009 G 0,002 E 0,073 K 0,033 Z 0,019 Ch 0,009 X 0,001 O 0,068 U 0,030 Y 0,016 Ý 0,008 Ó 0,000 A 0,054 R 0,029 Ň 0,015 Č 0,008 W 0,000 N 0,040 M 0,029 B 0,014 Š 0,007 Q 0,000 S 0,040 P 0,027 H 0,011 Ě 0,007 T 0,039 D 0,026 C 0,010 Ú,ů 0,005 V 0,039 Í 0,025 É 0,010 Ď 0,005 L 0,034 J 0,022 Ř 0,009 F 0,002 Tabulka 9: Relativní četnosti (pravděpodobnosti) písmen v češtině V předchozích tabulkách jsme použili statisticky zjištěné hodnoty četností a to nám dává jakési právo k tomu, abychom uvedli ještě jednu statisticky zjištěnou skutečnost. S Morseovou abecedou sice už nemá nic společného, pro nás Čechy je ale docela zajímavá. V šedesátých letech, v době okouzlení teorií pravděpodobnosti, se kybernetici a lingvisté spojili při hledání stále nových zákonitostí a vztahů, platných pro živé i archaické jazyky. Jeden z výzkumů spočíval v tom, že hledali úspornost vyjadřování různých živých jazyků psaných písmem založeným na latince. Měřili ji tak, že zjišťovali, kolik znaků své abecedy potřebuje jazyk k tomu, aby vyjádřil stejné myšlenky. Prakticky postupovali tak, že vzali shodné části v překladech všeobecně rozšířených děl do jednotlivých jazyků, vybrali jazykové mutace stejných úseků textu a spočítali znaky, které byly potřebné k jejich napsání. Průzkum byl jistě omezen na knihy, které byly všeobecně rozšířené a možná mohla hrát roli kvalita překladu (ta se ale při větším počtu vybraných děl nejspíš nakonec výrazně neprojevila). Výsledek byl zajímavý a pro mnohé překvapivý jako nejúspornější ze zkoumaných jazyků vyšla čeština. Když se nad tím zamyslíte, možná by to nemělo moc překvapovat. Český pravopis není spřežkový (jako třeba polština), ale diakritický, což zápis nepochybně zkracuje. Čeština také neužívá členy, o které se text v jiných jazycích prodlužuje. A konečně, česká mluvnice svou složitostí (například shodou podmětu s přísudkem) umožňuje vynechávat některé větné členy, které jsou v jiných jazycích nutné. Konec konců, právě díky diakritickému pravopisu má čeština o tolik víc znaků než například angličtina a my už jsme si v této kapitole jednou všimli, že čím méně početná abeceda, tím delší bývají kódová slova. Potvrdilo se nám to na dost nečekaném místě. 7.A.4 Číselné soustavy Do kapitoly o datech rozhodně patří také část o jejich zápisu, tedy o abecedách a mluvnicích jazyka, ve kterém jsou data zaznamenávána. V tomto případě se omezíme na data numerická. Rychle zjistíme, že nejsou tak samozřejmá, jak by se na první pohled zdálo, a že nastala jedna z těch situací, kdy je dobré si trochu udělat jasno v pojmech, kterými se budeme zabývat. Především, podstatou toho, co nás bude zajímat, je množství jinými slovy, kolik čeho je, jestli hodně, nebo málo, nebo tak akorát, jestli je nějaké množství větší než jiné, jestli roste nebo klesá. Až potud bychom mohli dost dobře vystačit jen se slovy, která se vyskytla v předchozí větě, a lidé si s nimi také dlouho docela dobře vystačili. I dnes etnografové zaznamenali primitivní kmeny, jejichž příslušníci neznají čísla a nepotřebují je. Když je zajímá, jestli mají víc ryb než ořechů, nebo naopak, položí ke každé rybě klacík, ke každému ořechu také, pak vezmou do jedné hrsti klacíky od ořechů, do druhé klacíky od ryb a celkem dobře poznají, která z obou hrstí je plnější. Jak se lidská civilizace ubírala svými klikatými cestami, stávalo se čím dál častěji, že slova jako hodně nebo málo na posouzení množství nestačila a bylo žádoucí, vyjadřovat množství přesněji. A tak si lidé vymysleli pojem počet. To slovo je už lidský výmysl a jeho význam se postupně rozšiřoval. Pokud se tehdy lidé chovali jako dnešní pralesní kmeny, začali s tím, že počet

34 rozlišovali nejprve na jeden-hodně, pak na jeden-dva-hodně (a u toho dost dlouho zůstali) a teprve pak začali přidávat termíny pro další konkrétní počty, zatím ještě ty přirozené, na které bezprostředně naráželi ve světě kolem sebe. Když postupně rostla potřeba pojmenovat různé konkrétní počty, dostávaly svá jména a vznikala čísla. Tady bychom měli předejít budoucím nedorozuměním, Čeština má zvláštní termíny pro označení konkrétních množství obecně, bez ohledu na to, jak jsou tato označení reprezentována navenek. Těm se říká čísla a slovní druh, který je ve verbální komunikaci vyjadřuje, jsou číslovky. Kromě nich máme ještě číslice, což jsou zvláštní písmena abecedy, používaná k zápisu čísel a některých číslovek (češtináři jim říkají číslovky určité ). Neměli bychom to plést čísla jsou jednoznačné specifikace konkrétních množství, číslovky jsou jejich jména v běžném jazyce a číslice jsou písmena abecedy, kterou můžeme čísla zapisovat. Protože se v těchto skriptech pohybujeme na území kybernetiky, můžeme předchozí větu trochu rozvést a říci, že čísla jsou obvykle prvky příslušné množiny čísel, nezávislé na konkrétním jazyce, číslovky už jsou vázané na komunikační jazyk, dají se ale i v jeho rámci zapsat různými abecedami a číslice už jsou vázány na existenci nějaké abecedy, tedy na existenci písma. Historické výzkumy ukazují, že nějaké znaky, hodně podobné číslicím, dokonce písmu předcházely. Už v archeologických nálezech, jeden z nich je dokonce z našich Věstonic, se objevily zvířecí kosti s nepochybně umělými zářezy dělanými pazourkovým ostřím a uspořádanými do skupin. Jejich stáří se pohybuje od asi 30 tisíc do 6 tisíc let před naším letopočtem a archeologové zatím považují za nejpravděpodobnější, že se jedná o záznamy množství. Ostatně, uzlové písmo kipu, používané peruánskými Indiány za dob Inků nebylo písmo v dnešním smyslu, ale také jen evidence množství ve složitě proorganizované správě inckého státu (proto jsme dali slovo písmo do uvozovek). Také moderní etnografové znají používání shodných zářezů na dvou hůlkách jako záznam množství dobytka vyháněného na letní pastvu (dokonce s jednou kopií pro hospodáře a jednou pro pastýře) v odborné literatuře pro ně existuje název vrubovky. Konec konců, čárky na pivním tácku jsou specifickým typem vrubovek užívaným dodnes. Předchozí, spíše prehistorický než matematický úvod do číselných soustav si zaslouží mírnou ilustraci. Mluvme na chvilku o množství, pro které má současná čeština číslovku dvacet osm. Číselná soustava, kterou užíváme my (a většina světa), pro ni ze svých znaků vytvořila slovo 28 (přičemž naše abeceda číslic je {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Staří Římané pro ni měli své slovo v latině a příslušný zápis v jejich číslicích 5 byl XXVIII. Mimochodem číslicová abeceda pro ně byla I =1, V =5, X =10, L =50, C =100, D =500, M =1000. Staří Řekové měli pro stejné číslo svou vlastní číslovku a ve svých číslicích je psali ΔΔΓΙIΙ (v archaické době) nebo kη (kapa=20, éta=8) v klasickém období. Abychom nezůstávali jen za humny, tak v mayských číslicích dlouho před Kolumbem se totéž číslo psalo.:.. Staří Egypťané měli mezi svými hieroglyfy celkem sedm číslic (pro čísla 1, 10, 100, 1 000, , , jsou na Obrázku 3, o sumerských číslech si ještě povíme později. Na nejstarších, ještě starověkých, číslicích je zajímavé (i když ne překvapivé), že pro malá čísla užívá svislé čárky pro jednotky (jako pozůstatek vrubovek ) a pokud mají symbol pro 5, často připomíná stylizovanou dlaň. 5 Římská číselná soustava vznikla kombinací řecké a etruské soustavy a šlo pravděpodobně o nejnepraktičtější číselnou soustavu v dějinách. Politujme středověké učence, kteří ji používali jeden a půl tisíciletí. Nelze se divit, že tehdejší kupci mnohem raději užívali abakus a podobné počítací pomůcky

35 Obr. 3: Egyptské hieroglyfy pro číslice. (převzato z www-history.mcs.st-andrews.ac.uk) Obr. 4. Než se budeme věnovat významnějším a pro praktické využití atraktivnějším číselným soustavám, měli bychom si uvědomit jednu věc. Tato část skript přímo navazuje na části o kódech, a protože jde také o různé zápisy pojmů pomocí znaků, mohlo by se zdát, že mezi obojím není podstatný rozdíl. Nuže, je. Kódování je přepis zpráv z jedné abecedy do jiné a je jedno zda jde o znaky pro hlásky, čísla nebo symboly početních a jiných operací. Pokaždé je to nahrazení jedněch slov jinými slovy, někdy stejné, někdy graficky nebo technicky jiné, abecedy. Číselná soustava je specializovaná abeceda a její mluvnice, tedy pravidla pro její používání, určená pro zápis čísel. Čísla a množství jsou natolik specifický typ pojmů, že si svou vlastní specializovanou abecedu vynutila. Po obecném, a do značné míry historickém úvodu se věnujeme významnějším typům číselných soustav. Právě v informatice a ve světě zpracování dat je užitečné se v nich vyznat. 7.A.4.1 Poziční soustavy Jak už jsme si tady řekli, číselných soustav bylo v historii (a, konec konců, pořád ještě je) mnoho. Některé z nich mají pozoruhodnou vlastnost, kterou zdědily vlastně už od vrubovek. Každá číslice v nich má svou (a vždy stejnou) hodnotu, bez ohledu na to, kam se v zápisu čísla umístí. Celková hodnota zapsaného čísla se spočítá tak, že se sečtou hodnoty všech zapsaných číslic, a pokud je to třeba, napíše se stejná číslice víckrát a počítá se tolikrát, kolikrát se v zápisu vyskytuje. U vrubovek to bylo celkem samozřejmé kolik bylo na kosti nebo klacíku zářezů, tolikrát se počítal jeden kus. Podobně tomu bylo třeba u egyptských hieroglyfů, jak vidíme na Obrázku 4, kde je zapsáno číslo 4622 a při jeho čtení je úplně jedno, na kterém místě je jaký hieroglyf nakreslen nebo vytesán. Takový zápis může mít své výhody, má ale také jednu podstatnou nevýhodu velikost čísla, které jím můžeme zaznamenat má své meze, dané zdravým rozumem a lidskou schopností vyznat se jen v omezeném množství grafických značek. Naštěstí se už skoro od samého začátku pokusů nějak zapsat čísla, objevily i jiné soustavy, říká se jim poziční, u kterých smysl číslice záleží na místě, na kterém se v zápisu čísla vyskytuje. Známe to vlastně už u číselné soustavy, kterou sami běžně používáme. Stále stejná číslice, třeba 5, má hodnotu 5, když je hned vlevo od desetinné čárky, hodnotu 50, je-li posunuta o jedno místo vlevo, 500, jestli je až na třetím místě vlevo od desetinné čárky, a tak dál. Vpravo od desetinné čárky je tomu podobně. Naše číslice 5 znamená pět desetin, je-li hned na prvním místě vpravo od desetinné čárky, ale pět setin, je-li o jedno místo dále vpravo,. Takové číselné soustavy jsou výhodné, vystačí s několika málo číslicemi a přitom se dají použít na zápis mnohem bohatší zásoby čísel, ale vyžadují znalost dost přesných pravidel pro jejich používání. V následujících částech této podkapitoly se seznámíme s některými z těch soustav, které se používají v počítačových oborech. Dříve si však stručně představíme několik z těch, které vytvořili naši prapředkové, popřípadě s několika, které měly některé prvky pozičních soustav, ale doslova poziční nebyly

36 Zjevně první číselnou soustavu, která byla v podstatě poziční, vytvořili v Mezopotámii, někdy kolem roku před naším letopočtem. Využívala klínové písmo a byla pozoruhodná nejen na svou dobu, ale i z dnešního hlediska. Užívala v podstatě jen dva klínopisné znaky a jimi uměla napsat čísla od 1 do 59 v dekadické soustavě. Jak takové zápisy vypadaly, můžeme vidět na Obrázku 5, kde si můžeme všimnout, jak kombinovala znaky (číslice) pro 1 a 10. Záleží na nás, zda a do jaké míry budeme tento zápis čísel považovat za poziční. Pokud Sumerům (někdy se mluví o Babyloňanech) uznáme jen dvě číslice (úzký klínek pro 1 a široký klínek pro 10), bude soustava sice jednoznačně dekadická, ale ne tak docela poziční. Jednotlivé klínky v zápisu čísla by mohly být v uzavřeném bloku, zapisujícím ono číslo, umístěny různě a jeho hodnota se zjistí sečtením jejich hodnot. Pokud ale uznáme každý shluk klínků za jednu číslici (obvyklé čtení klínového písma to plně ospravedlňuje), pak bychom vlastně nemohli o dekadické soustavě formálně vůbec mluvit a soustava na obrázku je vysloveně šedesátková. Číslovka na první pozici odprava udává počet jednotek, číslovka vlevo vedle ní znamená počet šedesátek, další číslovka vlevo znamená, kolikrát se do celkové hodnoty čísla vejde 3600 (tedy 60 2 ), pokud to bylo víc než šedesátkrát, tak také, kolikrát se vejde (což je 60 3 ) a tak dál. Obr. 5: Klínopisné znaky pro sumerská (babylonská) čísla od 1 do 59 (převzato z Wikipedie) Například číslo, které my píšeme jako , napsali oni jako: a znamenalo to symbol pro 6, symbol pro 32, symbol pro 23, symbol pro 35, = = 6 ㆍ ㆍ ㆍ ㆍ 60 0 = Předchozí ukázka, jakkoli byla neaktuální, nám ukázala základní princip každé poziční číselné soustavy. Jejím základem je vždy nějaké přirozené číslo, ne menší než 2 a nepříliš velké (zatím jsme se setkali nejvýš s šedesátkovou soustavou). Počet jejích znaků číslic je roven právě tomuto číslu. Zápis každého čísla v poziční abecedě tvoří konečná posloupnost číslic, která představuje nejkratší rozklad čísla na součet mocnin základu soustavy. V jazyce dnešní matematiky je popis poziční číselné soustavy celkem přehledný. Předpokládejme, že abeceda má základ z a množinu číslic A o z prvcích. Každé číslo X pak zapíšeme jako konečnou posloupnost x n, x n-1, x n-2,, x 2, x 1, x 0, x -1, x -2,, x -m A, číslic, takových že X = x n. z n + x n-1. z n-1 + x n-2. z n x 2. z 2 + x 1. z 1 + x 0. z 0 + x -1. z -1 + x -2. z x -m. z -m

37 Počítání s čísly zapsanými v poziční soustavě je poměrně jednoduché pro desítkovou soustavu ho známe z denní praxe a pro jiné základy se nijak podstatně neliší. Jen pro ilustraci si ukážeme sčítání dvou víceciferných čísel v poziční soustavě o základu z. Příklad Předpokládejme, že máme čísla x = x 3 x 2 x 1 x 0, x -1 x -2 a y = y 2 y 1 y 0, y -1 y -2 y -3 kde použitý zápis čísel znamená, jako obvykle, že x = x 3 z 3 + x 2 z 2 + x 1 z 1 + x 0 z 0 + x -1 z -1 + x -2 z -2, y = y 2 z 2 + y 1 z 1 + y 0 z 0 + y -1 z -1 + y -2 z -2 + y -3 z -3. Pak nejdříve sečteme koeficienty x i a y i u každé i-té mocniny základu. Tak dostaneme polotovar výsledku x + y = x 3 z 3 + (x 2 +y 2 ) z2 + (x 1 +y 1 ) z + (x 0 +y 0 ) + (x -1 +y -1 ) z-1 + (x -2 +y -2 ) z-2 + y -3 z -3. Pokud jsou koeficienty u všech mocnin menší než číslo z, je výpočet součtu hotov. Pokud je pro některou mocninu i hodnota x i + y i z, znamená to, že je číslo x i +y i v číselné soustavě o základu z alespoň dvouciferné. Pak nahradíme koeficient x i +y i jeho poslední číslicí a ostatní číslice (nebo číslici) přičteme ke koeficientu x i+1 + y i+1 u mocniny z i+1. Připadá vám to nějaké složité? Tak si vzpomeňte, co děláte při sčítání dvou čísel v dobře zvládnuté desítkové soustavě a uvědomíte si, že tak hrozné to zase není. Poznámka Není těžké dokázat, že popsaný rozklad čísla X je vzájemně jednoznačný - je to jediný takový rozklad a naopak, je jím definována právě jedna číselná hodnota. Je také zřejmé, že takovým způsobem je možné definovat každé reálné číslo prostým prodloužením nebo zkrácením uvedené posloupnosti na obou koncích, a to bez omezení. Civilizace, které používaly poziční číselnou soustavu, narazily dříve nebo později (a většinou hodně brzy) na otázku, co dělat v případech, kdy některá mocnina základu z není pro rozklad čísla potřebná. U nepozičních soustav, kde se hodnota čísla získává prostým součtem hodnot jednotlivých číslic, takový problém nevzniká hodnoty, které v zápisu nejsou potřebné, se do něj prostě nepíší a nic se nestane. To u pozičního zápisu nestačí při pouhém vynechání některého členu v rozkladu čísla X obvykle hrozí nepříjemné nedorozumění. Proto je nezbytné pro potřeby poziční číselné soustavy ustálit nějaký symbol, který by takové vynechané místo spolehlivě označil. Obr. 6. Babylónská klínová číselná soustava. Každého dnešního absolventa základní školy jistě okamžitě napadne, že koeficient x j u takové vynechané mocniny základu bude prostě roven nule. Nám, kteří to děláme, se to přinejmenším dobře osvědčuje. Problém byl v tom, že starověké národy, které měly písmo a uměly zapisovat čísla, symbol pro žádné množství neměly. Postupně si s tím ale poradily. Nejprve na místě vynechané

38 mocniny základu nechávaly volné místo, ale to se, hlavně u některých písařů, dost špatně poznávalo. Výjimkou byli Číňané jejich písmo se už před naším letopočtem psalo ve znacích zhruba čtvercového tvaru a vynechaný čtvereček se v rytmu písma dobře poznal. Také Sumerové a Babylóňané začali tím, že vynechávali místo, ale u jejich klínového písma se to moc nepoznalo, takže nakonec vynalezli znak, který na uvolněné místo psali. Najdete ho na Obrázku 6. Egypťané, Židé ani Řekové poziční číselnou soustavu neměli, římská číselná soustava byla tak krkolomná, že by jí ani nula nemohla v ničem pomoci a tak se bez ní musel obejít i celý evropský středověk (a proto ani v letopočtu není rok nula). Teprve Indové zavedli do své desítkové poziční soustavy také znak pro nic tedy nulu (dokonce také jako malý kroužek). Zavedení nuly se přičítá matematikovi Brahmaguptovi, který žil v sedmém století našeho letopočtu. Od nich převzali dekadickou soustavu s nulou Arabové a přes ně se teprve v desátém století začala dostávat do Evropy. První se ji naučil mnich a výborný matematik Gerbert z Aurillacu, který začínal v Katalánii, na dosah od maurské Córdoby a její vzdělanosti (a skončil jako papež Silvestr II. v Římě). Gerbert ale ještě převzal arabskou soustavu bez nuly počítal na počítadle (abaku) a tam ji nepotřeboval. Nulu rozšířil v Evropě jako praktickou počtářskou pomůcku až Ital Leonardo z Pisy (většinou známý jako Fibonacci) na začátku třináctého století. Obr. 7. Mayská dvacítková číselná soustava (převzato z elixirofknowledge.com). Řády se v ní nepíší vedle sebe, ale nad sebou, jednotky dole, dvacítky nad nimi. Nula, i když na to lidé přišli dost pozdě, je velmi důležitý nástroj pro počítání s číselnými daty a pro zápis čísel. Tak důležitý, že ho nezávisle na asijských a evropských matematicích vynalezli i Mayové v dalekém zámoří. Současně si ale i oni uvědomili to, co nám, při našem mechanickém zapisování čísel už ani nedochází že totiž nula je jako číslice docela mimořádná na rozdíl od ostatních číslic (a také číslovek), které vždy označují několik, počet který je, nula označuje nic počet, který vůbec není, množství, které neexistuje. Na Obrázku 7 vidíme, že i Mayové pro ni měli symbol úplně odlišný od ostatních číslic své dvacítkové soustavy místo rovných čar (pro 5) a teček (pro 1) ji kreslili jako mušli kdo ví proč. Předcházející historický úvod tady nebyl pouze pro odlehčení, ani jen proto, aby ukázal, jak dlouho se počtáři museli obejít bez tak důležitého symbolu jakým je nula, ale kvůli něčemu podstatně důležitějšímu, co je pro pochopení pozičních číselných soustav a jejich fungování dost podstatné

39 Poznámka V matematice, i když si to každý neuvědomuje, existují vlastně dvě, významem značně odlišné, nuly, i když pro ně často (také v naší soustavě), existuje stejný grafický symbol. První, o které jsme zatím mluvili, se jmenuje poziční nula a označuje prázdné místo v pozičním zápisu čísla. Má pokaždé vlastně jiný význam žádná jednotka, žádná desítka,, žádný milion, (v naší desítkové soustavě), žádné z n (v obecném zápise). Poziční nulu znaly už starověké národy, které užívaly poziční číselné soustavy Číňané, Sumerové a Babylóňané, Indové. Druhá nula znamená nic, žádné množství, má tedy jen jeden význam, který je nezávislý na použité číselné soustavě, mohl by být graficky označen úplně jiným symbolem než poziční nula, a který se v matematice zabydlel až poměrně pozdě. V řeči množin znamená tato nula počet prvků prázdné množiny a my jí budeme říkat množinová nula (pokud budeme potřebovat obě nuly jasně odlišit). Teprve už zmíněný Brahmagupta si uvědomil existenci obou nul a je považován za objevitele té množinové. V Evropě ji pochopil až také už zmíněný Fibonacci a ve svých knihách ji naučil používat i své současníky. Například staří Řekové, jakkoli byli vynikající matematici, si neuvědomili ani jednu z nich a i když jim někdy při výpočtech vyšlo nic, rozuměli mu jen, když znamenalo konečný výsledek výpočtu, ale byli bezradní, když na ně narazili jako na mezivýsledek. Tolik o pozičních soustavách obecně. Pro zápis kvantitativních dat jsou neporovnatelně vhodnější než jiné. Proto se ještě krátce zdržíme u tří z nich: naší desítkové, počítačové dvojkové, a u také počítačové šestnáctkové. Než se jim věnujeme blíž, připomeneme si ještě terminologii obvyklou pro jejich názvy znát cizí slova se občas hodí. z = 2 binární (dvojková) používá se hlavně v programování, z = 5 pentální (pětková) dnes se používá jen málo; ve starověkých kulturách je častější základem je počet prvků jedné ruky, z = 8 oktální (osmičková) jen vzácně ve výpočetní technice; výhoda je v úspornosti (viz kódování) jejím základem je třetí řád v binární soustavě (dříve se však běžně používala například při programování na počítačích sovětské výroby MINSK) z = 10 dekadická (desítková) z = 12 duodecimální (dvanáctková) ve většině současných pozičních číselných soustav; ujala se hlavně proto, že odpovídá počtu prstů na rukou, jinak ale není příliš praktická, zachovala se částečně v počítání času; dříve byla celkem častá (první řád = tucet, druhý řád = veletucet), z = 16 hexadecimální (šestnáctková) využívá se ve výpočetní technice výhoda je v úspornosti (viz kódování) jejím základem je čtvrtý řád dvojkové soustavy (obsah jednoho bytu je zapisován dvěma hexadecimálními číslicemi), z = 20 vigesimální (dvacítková) používala se někdy ve starých civilizacích (Mayové a také staří Slované poté co začali používat cyrilici); její základ odpovídá počtu prstů na rukou i nohou, jinak není příliš praktická, z = 60 sestadecimální (šedesátková) velmi výhodná při počítání zpaměti, její základ 60 je beze zbytku dělitelný 2, 3, 4, 5, 6, 10, 12, 15, 20, 30; dodnes se zachovala v počítání času, sexagesimální soustava kombinace desítkové a šedesátkové soustavy používaná v Sumeru a Babylónii; praktická při počítání zpaměti a na svou dobu promyšlená

40 7.A.4.2 Desítková soustava Je to soustava, kterou běžně používáme. Jak už víme, dostala se k nám od Indů přes arabské matematiky a v Evropě se ujala poměrně pozdě. Běžné algoritmy pro aritmetické operace s čísly v desítkové soustavě se děti učí na základní škole a to ji činí vhodnou k tomu, abychom si na ní ukázali podstatu desítkové soustavy. Začneme podrobným rozborem toho, co vlastně děláme, když zapisujeme nějaké číslo v desítkové soustavě. Bude to vypadat na první pohled nadbytečné, ale někdy neškodí, udělat věci, na které už ani pořádně nemyslíme, jako bychom na ně museli myslet. Za chvíli se to bude hodit. Příklad Začneme tím, že máme shromážděnu nějakou množinu objektů. Třeba tuhle: (nedejte se ovlivnit většími mezerami mezi některými skupinami objektů mají vám jen usnadnit počítání). Zatím pro množství těchto objektů nemáme jméno, ani je neumíme napsat. Protože jsme se ale v této části rozhodli pro desítkovou soustavu se základem 10, víme, že nás bude zajímat, jak se dají naše objekty rozdělit do skupin, ve kterých bude vždy počet objektů roven nějaké mocnině čísla 10. Mocniny čísla deset jsou: jednotky : (1 = 10 0 ), desítky : (10 = 10 1 ), stovky : (100 = 10 2 ), tisíce : (1 000 = 10 3 ), desetitisíce : ( = 10 4 ), a tak dál, pro ostatní celočíselné mocniny. Jak dopadne naše množina objektů, když ji zkusíme rozdělit na části podle uvedených mocnin základu 10? Při troše námahy se dá ověřit, že objektů není ani tisíc, takže se mocnina 10 3 ani žádná vyšší neuplatní. Druhá mocnina základu, to znamená 10 2, se do naší množiny objektů vejde dvakrát, takže pokryje skupiny

41 Zbývá ještě skupina která už další skupinu o 10 2 prvcích nenaplní. Podíváme se tedy na skupiny o řád menšími, které mají 10 1 prvků. Do našeho zbytku se jich vejde osm: a nakonec zbylo posledních několik prvků které už nenaplní další skupinu o 10 1 prvcích. Bude proto nutné ji vyjádřit několika skupinami o 10 0 prvcích. Takových jednoprvkových skupin je pět. Když předchozí postup shrneme, rozdělili jsme prvotní, do té doby nepojmenovaný, počet prvků naší množiny na a protože víme, o jaký základ číselné soustavy se jedná, můžeme tento zápis zkrátit na trojici důležitých čísel 285. Poznámka Na naší desítkové soustavě dobře vidíme, proč každá poziční soustava potřebuje poziční nulu. Bez ní bychom nedokázali rozeznat, jestli právě napsané číslice znamenají číslovku 285, 2085, 28500, nebo nějakou jinou podobnou. Poznámka Už z Poznámky 7.13 víme, že zápis v každé poziční soustavě, tedy i desítkové, je vzájemně jednoznačný. Možná by se našel někdo, kdo by chtěl zapsat číslo 285 sice s použitím principů desítkové soustavy, ale nějak jinak. Třeba by místo osmi skupin po 10 1 objektech použil jen sedm takových skupin a tu poslední, osmou, by rozdělil do jednočlenných skupin po 10 0 objektech. Takových skupin by potřeboval patnáct. Pokud by si vytvořil zvláštní symbol pro množství nazývané patnáct, třeba [ 15 ], byl by v jeho soustavě zápis našeho čísla 27[ 15 ] a zdánlivě by se nic moc nedělo. Jenomže ono by se dělo byla by porušena obě pravidla pro tvorbu poziční číselné soustavy uvedené v minulé části. Přesněji řečeno: Soustava by potřebovala (včetně nuly) víc cifer než deset (což je její základ). Rozklad na části odpovídající jednotlivým řádům základu soustavy by nebyl nejkratší jedna desetičlenná množina (jedna z množin řádu 10 1 ) by byla nahrazena deseti Jednočlennými skupinami (skupinami řádu 10 0 ). Proto takový rozklad není možný. Podobně postupujeme při zápisu čísel menších než 1. Řády základu 10 jsou pro čísla mezi 1 a 0 : desetiny : (0,1 = 10-1 ), setiny : (0,01 = 10-2 ), tisíciny : (0,001 = 10-3 ), desetitisíciny : (0,0001 = 10-4 ), a tak dál

42 Když obě předchozí poznámky a odstavce před nimi shrneme, potvrdíme si právě to, co už dávno známe, přinejmenším od první nebo druhé třídy základní školy. Desítková soustava má (včetně poziční nuly) přesně deset číslic, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, kterými je možné napsat každá reálné číslo. Jinými slovy, počet množin s počtem prvků rovným nějakému řádu desítky, musí být nejvýše 9 a může klesnout až k 0. Pokud by přerostl přes devět, musíme deset z těchto množin nahradit jednou množinou o řád vyšší. Také počítat v desítkové soustavě už umíme od dob nižších tříd základní školy, a pokud jsme to nezapomněli, umíme to dodnes, navzdory kalkulačkám a podobným počítacím udělátkům. Mimochodem, ty počtářské algoritmy pro algebraické operace s indo-arabskými čísly vytvořil až (nebo už?) arabský učenec Mohamed Ibn Musa al Chwárizmí, současník pohádkového Haruna al Rašída a jeho nástupce al Mamúna začátkem devátého století. Evropané, kteří nepoužívali poziční dekadickou soustavu, ale nepraktická římská čísla, ještě dlouho (až do 13. století a mnozí ještě déle) raději počítali na počítadle nazývaném abakus. Obecný postup sčítání v poziční soustavě jsme si ukázali v minulé části, sčítat v desítkové umíme, a sčítání v některých dalších si ukážeme, až na ně dojde. 7.A.4.3 Binární soustava Používání binární (dvojkové) soustavy je díky programování a výpočetní technice poměrně rozšířené ve světě počítačů, nicméně neuškodí, seznámit se s ní ještě jednou, tentokrát pod zorným úhlem toho, co už o číselných soustavách víme obecně. Tím spíš, že při studiu řady problémů nebo postupů aplikované informatiky je velmi vhodné se v binární číselné soustavě a práci s ní dobře a rutinně orientovat. Nuže, binární soustava je poziční. Její základ je z = 2. Jednotlivé pozice zápisu každého čísla tedy představují počet příslušných mocnin čísla 2. Systém má jen dvě číslice, 0 a 1, přičemž 0 je tak zvaná poziční nula. Pro snazší počítání si připomeňme několik mocnin binárního základu na prvních místech dvojkového zápisu: 2 0 = 1, 2 1 = 2, 2 2 = 4, 2 3 = 8, 2 4 = 16, 2 5 = 32, 2 6 = 64, 2 7 = 128, 2 8 = 256, 2 9 = 512, 2 10 = 1024, 2-1 = ½ = 0,5, 2-2 = ¼ = 0,25, 2-3 = 1/8 = 0,125, 2-4 = 1/16 = 0,0625, 2-5 = 1/32 = 0,03125, 2-6 = 1/64 = 0,015625,. Příklad Zkusme ve dvojkové soustavě zapsat číslo, se kterým jsme se už setkali v minulém příkladu. Bylo to číslo, které v dekadické soustavě píšeme jako 285 a označuje množinu objektů předvedenou už v Příkladu Kdo si ji chce připomenout, snadno ji tam najde. Náš úkol je, zjistit, jak můžeme počet dvě stě osmdesát pět zaplnit co nejúspornějším způsobem mocninami dvojky. Nejvyšší mocnina 2 n, která se vejde do 285 je 2 8 = 256 pro n = 8. Zbývá 29 a do tohoto množství se z mocnin 2 n vejde až 2 4 = 16 pro n = 4. Tentokrát zbývá 13 prvků množiny, které nejlépe pokrývá 2 3 = 8 a n = 3. Zbylo 5 prvků, pro které stačí 2 2 = 4, přičemž n = 2. Nakonec zbyl 1 prvek, což je 2 0 = 1 a n = 0. Když dáme předchozí řádky dohromady, dostaneme se, že množství, popsané slovy dvě stě osmdesát pět se rovná následujícímu součtu mocnin dvojky =

43 Pozornosti jistě neušlo, oč delší je zápis ve dvojkové soustavě (má 9 číslic) oproti zápisu v desítkové soustavě s pouhými třemi číslicemi. Je to jev, který přirozeně vyplývá z chudosti binární abecedy, a v jistém smyslu jsme se s ním setkali už v podkapitole o kódování. Příklad Pro změnu zkusme převést na zápis v binární soustavě číslo s desetinnými místy. Zvolme třeba, jak by vypadal binární zápis čísla 2, Zapsat jeho celočíselnou část už umíme: dekadickému zápisu 2 odpovídá binární 10. Jak to bude se zlomkovou částí čísla? 0, = 0,5 + 0, , = 1/2 + 1/8 + 1/64 = To znamená, že zápis dekadického čísla 2, je ve dvojkové soustavě 10, Poznamenejme, že zápis, který jsme v binární soustavě použili, je analogií toho, čemu se při používání dekadické číselné soustavy říká desetinný zápis. U binární soustavy by takový název byl nesmyslný, místo desetinný se v ní říká binární zlomek. S čísly zapsanými v binární soustavě můžeme počítat naprosto stejně jako s dekadickými a používat zcela analogický algoritmus. Jen nesmíme zapomenout na to, že = = = = = 1 0 = = = 1. Ověřme si to na několika aritmetických operacích. Příklad Sečtěme dvě čísla. Například ta, která se v dekadickém tvaru vyslovují pět set šestnáct a sedm set dvacet osm. V dekadických číslicích = V rozkladu na mocniny dvojky 516 = = , takže binární zápis je = = , takže binární zápis je Použijeme-li obvyklý algoritmus pro sčítání, který známe z dekadické soustavy, dostaneme A není žádný velký problém se přesvědčit, že to je binární zápis čísla Příklad Podobně si zkusíme i násobení dvou celých čísel. Třeba = Po binárním rozkladu obou čísel dostaneme 120 = = , což je v binárním zápisu , 20 = = a v binárním zápisu to je Také při násobení použijeme algoritmus, který známe ze základní školy, kdy jsme se učili počítat s dekadickými zápisy čísel x Binární výsledek můžeme psát jako rozklad na mocniny dvojky = = Jistě nikoho nepřekvapí, že v binární soustavě není problém napsat i zlomky. Jak ty s desetinnou, tedy správně binární čárkou (to už jsme si zkusili), tak ty se zlomkovou čarou (říká se

44 jim kmenové). Buďme o něco matematicky přesnější zlomková čára je jenom symbol pro dělení, takže kmenové zlomky jsou ty, které představují podíl (poměr) dvou celých čísel (pro milovníky jazyků ratio je latinsky poměr; odtud název racionálních čísel). V každém případě je úplně přirozené, podívat se, jak je tomu s racionálními čísly v binární soustavě. Konkrétně: Má smysl mluvit o binárně racionálních číslech, stejně jako mluvíme o (dekadicky) racionálních? Pokud ano, jsou to stejná čísla (to znamená čísla, zapsaná sice jinou soustavou, ale vyjadřující stejné množství)? Kladná odpověď na druhou otázku by totiž znamenala, že racionalita jako vlastnost, či jako jev, je nezávislá (invariantní) na tom, zda je číslo zapsáno dekadicky nebo binárně (a silně by to podpořilo naše podezření, že je racionalita čísla zcela invariantní na jeho zápisu kterékoli soustavě. Chcete-li to říci o něco abstraktněji, tak přemýšlíme o tom, jestli je racionalita přírodní vlastnost nezávislá na našem vnímání, nebo jestli je to umělá konstrukce, která stojí a padá s tím, jakou číselnou soustavu užijeme. To už by za zamyšlení mohlo stát. Začněme s první z obou otázek. Je jednoduchá a odpověď na ni také. Napřed si připomeňme, že (zatím jen v dekadické soustavě) jsou racionální ta čísla, která je možné napsat jako kmenový zlomek. Pokud je chceme přepsat do tvaru desetinného zlomku, je to možné, ale onen desetinný zlomek bude od nějakého místa za desetinnou čarou periodický (bude se stále opakovat stejná skupina číslic). Dokonce nebude žádnou výjimkou to, že onou nekonečně opakovanou skupinou bude nula 0. Například 2/3 = 0, , 3/4 = 0, Vrátíme-li se k naší otázce, tak je možné zapsat v binární soustavě jak zlomek binární (s binární čárkou mezi nultým a mínus prvním řádem rozkladu na mocniny dvojky), tak nám nic nebrání v tom, zapsat kmenový zlomek, se zlomkovou čarou jako symbolem dělení. Je ale pravda to, co jsme si řekli o dekadických racionálních číslech že v nich lze kmenové zlomky přepsat jako racionální s tím, že se nevyhneme periodicitě? Začněme jasnými příklady totiž binárními parafrázemi dvou příkladů, které jsou vedeny o několik řádek výše. Dekadickým zlomkům 2/3, a 3/4 odpovídají binární zlomky 10/11 = 0, a 11/100 = 0, Tady nás binární soustava nezklamala a platí dokonce i obecné pravidlo. Poznámka Racionalita je vlastnost invariantní na zvolené číselné soustavě (pokud zná a je schopna zapsat zlomky). To znamená, že číslo, racionální při zápisu do desetinné soustavy bude racionální právě tehdy, když bude racionální jeho přepis do binární soustavy. Neměli bychom ale propadat přílišnému optimismu, pokud jde zápis racionálních čísel pomocí desetinných (v dekadické soustavě) nebo binárních (ve dvojkové soustavě) zlomků. Už jsme si připomenuli, že pokud racionální číslo přepíšeme na desetinný zlomek, budou se skupiny číslic od některého místa periodicky opakovat, nebo bude od některého místa obsahovat samé nuly. Například 91/11 = 8, nabývá v binárním zápisu tvar /1011 = 1000, To ale vůbec neznamená, že číslo, jehož přepis na desetinný zlomek v dekadické soustavě končí po konečném počtu míst nulami, bude stejně končit i při binárním zápisu. Například desetinné zlomky, na jejichž zápis stačí konečný počet míst, konkrétně třeba 1/2 = 0,5, 1/5 = 0,2 nebo 1/10 = 0,1-44 -

45 vycházejí ve dvojkové soustavě trochu jinak: (1/5) 1/101 = 0, , (1/10) 1/1010 = 0, , nicméně převod zlomku 1/2 do binární soustavy bude mít jen konečné množství nenulových číslic V čem je rozdíl? 1/2 = 0,1. Poznámka V každé poziční číselné soustavě je možné převést kmenový zlomek do tvaru součtu konečně mnoha mocnin základu číselné soustavy právě tehdy, když je příslušný (odpovídající) jmenovatel zlomku dělitelem některé mocniny tohoto základu. Předchozí tvrzení je sice velmi jednoduché, jeho zápis ale vypadá trochu nepřehledně a tak si ho ilustrujeme na příkladech. Nejdřív se vrátíme k číslu, které se v desítkové soustavě píše 1/10, pokud si je přejeme ve tvaru kmenového zlomku, anebo ve tvaru 0,1 pokud si přejeme zápis desetinný. Základem (zvykli jsme si, označovat ho z) dekadické soustavy je číslo 10, které je, přirozeně, dělitelné samo sebou. Podle předchozí poznámky to stačí k tomu, aby měl příslušný desetinný zápis jen konečný počet nenulových číslic dokonce jen jednu za desetinnou čárkou. Číslo 10 ale není dělitelem ani čísla 2 (základu binární číselné soustavy), ani žádné jeho mocniny. A skutečně, po přepisu čísla 1/10 do dvojkové soustavy (už víme, že to je 1/1010), zjistíme, že je to binární zlomek s nekonečným opakováním skupiny číslic 0011 za desetinnou čárkou. Pro změnu číslo 7 není dělitelem ani dekadického základu 10, ani binárního základu 2, ani žádné z jejich mocnin. Proto také ani zlomek 1/7 ani zlomek 1/111 není možné beze zbytku převést na desetinný, případně binární, zlomek s konečným počtem platných nenulových číslic. Vždy se bude donekonečna opakovat několik z nich. Konkrétně 1/7 = , 1/111 = 0, Tím jsme si ukázali základy zacházení s binární číselnou soustavou a snad i do jisté míry osvojili základy zacházení s ní. Je to pro informatiku soustava v podstatě klíčová, nejen vlastním užíváním v praxi, ale i tím, že vytváří potřebný nadhled pro práci s číselnými soustavami, kódy a daty. 7.A.4.4 Šestnáctková soustava K počítačovým vědám patří také šestnáctková (hexadecimální) soustava. Zejména v prvních obdobích vývoje počítačů a počítačových softwarů byly důvody pro její používání poměrně silné. Šestnáctková soustava má totiž při programování jednu podstatnou výhodu kódování jejích symbolů v binárním kódu je úspornější než kódování dekadické soustavy. Abychom si to vysvětlili, vrátíme se trochu do kapitoly o kódování, kódových abecedách a kódových slovech. Z praktických důvodů jsou data všeho druhu, číselná i ta ostatní, se kterými přímo pracuje počítač, kódována v binárním kódu. To znamená, že každé jednotlivé písmeno (bit) zakódovaných dat může nabývat jen jednu ze dvou hodnot. Abeceda zdroje, jejíž znaky přinášejí data pro počítač, je samozřejmě mnohem bohatší a proto se stalo normou, kódovat její znaky binárními kódovými slovy ustálené a vždy stejné délky. Délka takových kódových slov, (Bytů v češtině se také užívá tvar bajtů) může být přizpůsobena hardwaru konkrétního počítače, ale bajty o 8 bitech se od jisté doby považují za klasický standard, i když moderní výpočetní technika nabízí i počítače konstruované na bloky o 16, 32, nebo 64 bitech. Hardware počítače je vždy konstruován tak, aby četl celý blok (celou skupinu znaků) jako jeden celek (něco jako znak nějaké nové abecedy kódových slov) proto je velmi žádoucí, aby bloky měly stejnou délku, nejvýše je možné je využít tak, aby jeden blok (jedno kódové slovo) kódoval skupinu několika znaků původní vstupní abecedy. To, že bývá počet bitů v bloku vždy mocninou dvojky, má své praktické výhody. Především je možné takový blok v případě potřeby vždy rozdělit na poloviny, ty zase na poloviny, a tak dál, což sice omezuje délku vstupních skupin znaků abecedy zdroje dat na mocniny dvojky, zato to zjednodušuje a zrychluje funkci registrů, kterými se vstupní data zpracovávají(?)

46 My si ale všimneme něčeho jiného. Už víme, že můžeme považovat bajt za kódové slovo v kódu s dvojkovou kódovou abecedou {0, 1} o konstantní délce slov. Jak dlouhá by ta slova měla být, to záleží na tom, jak bohatá je abeceda zdroje (kolik má znaků). Kódová slova o délce 8 binárních znaků postačí k zakódování celkem 256 znaků vstupní abecedy (abecedy zdroje) do binární abecedy počítače. Tvůrcům prvních generací počítačů to připadalo jako poměrně dost. 256 písmen bohatě pokrývá abecedy založené na latině, řeckou alfabetu, samozřejmě také arabské číslice, azbuku a speciální matematické nebo jiné symboly včetně rozlišení velkých i malých písmen. V nejhorším případě bylo možné kódovat kombinací dvou nebo více bajtů další málo obvyklé znaky. Pro speciální nevelké a nějak typické skupiny znaků bylo naopak možné (a užitečné) rozdělit osmibitový bajt na poloviny a kódovat je kódovými slovy jenom poloviční (nebo kratší) délky. Tím se dostáváme k důvodům pro šestnáctkovou číselnou soustavu. Dekadická číselná soustava má, jak víme, deset znaků 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Pokud je chceme zakódovat do slov stálé délky ve dvojkové abecedě, potřebujeme k tomu, aby ona slova měla délku 4 bity (nic nám nebrání použít i delší slova, pokud se rozhodneme rozmařile plýtvat pamětí počítače). Tři bity ještě nestačí, těmi je možné zakódovat nejvýše osm znaků. Věta, kterou jste si právě přečetli, vysvětluje, proč svého času pošilhávali konstruktéři prvních počítačů i po osmičkové soustavě. Na kódování osmi číslic do binární kódové abecedy stačí kódová slova, bajty, o třech znacích, a to znamenalo, v době, kdy byla paměť počítače a práce s ní náročná na prostor i čas, značnou úsporu. Konstruktéři počítačů ale nakonec zkusili opačnou cestu (také proto, aby délka bajtů byla mocninou dvojky) a zkusili počítat v šestnáctkové soustavě. Na kódování jejích číslic stačí kódová slova o délce poloviny standardního bajtu tedy o 4 bitech. Hardwarové uspořádání počítače pak četlo vždy dvě číslice najednou (jinak řečeno, kódovalo dvojčíslicová slova šestnáctkového zápisu do binárního kódu s osmibitovými slovy). Mělo to zase hlavně výhodu úspornosti nezbývala žádná nevyužitá čtyřbitová kódová slova, kterými by nebylo co kódovat. Když už tušíme, co motivovalo tvůrce šestnáctkové číselné soustavy, řekneme si něco o ní samé nebude toho mnoho, vcelku bychom opakovali to, co už víme o předchozích dvou soustavách. Šestnáctková soustava má, včetně nuly, šestnáct číslic. Protože nám jich naše dekadická civilizace nabízí jen deset, musíme ty zbývající nahradit písmeny a ustálilo se jejich následující značení 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F. Jako další číselná hodnota v řadě by bylo šestnáct, a psala by se 10. Pak by postupně následovala čísla 11, 12, 13, 14, 15, 16, 17, 18, 19, 1A, 1B, 1C, 1D, 1E, 1F, 20, 21,, Přičemž například zápis 13 tady znamená devatenáct (v našem obvyklém dekadickém světě), 1C znamená dvacet osm, a tak jdou čísla dál až k FF, které v našem obvyklém vnímání znamená dvě stě padesát pět. Následuje 100, které znamená dvě stě padesát šest (tedy druhou mocninu základu z = šestnáct. Netrénovaní jedinci mají s užíváním šestnáctkové soustavy hodně potíží, přinejmenším do té doby, než se jim podaří vytlačit z paměti všechno užitečné, co se učili od první třídy základní školy. Například, že když v ní vidí zapsáno 325, není to to, co by si každý myslel, ale 325 = 3 (šestnáct) (šestnáct) (šestnáct) 0 = 3 (dvě stě padesát šest) + 2 (šestnáct) + 5 (jedna) = (osm set pět). Pokud máte pořád ještě pocit, že se v zacházení s šestnáctkovou soustavou snadno orientujete, zkusíme si sečíst dvě čísla v šestnáctkové soustavě. Pro přehlednější čtení budeme čísla v normální dekadické soustavě zapisovat netučnou italikou, tedy číslicemi 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,. Příklad Sečteme šestnáctková čísla 3C45 + FA0. Napřed je rozepíšeme jako součet mocnin základu z =

47 3C45 = 3 (16) 3 + C (16) (16) (16) 0 = C = = = FA0 = F (16) 2 + A (16) (16) 0 = = Pro kontrolu tedy víme, že v desítkové soustavě by měl vyjít výsledek = Zkusíme, zda nám stejný výsledek vyjde i při sčítání jednotlivých mocnin šestnáctkového základu. 3 (16) 3 + C (16) (16) (16) 0 + F (16) 2 + A (16) (16) 0 = = 3 (16) 3 + (C+F) (16) 2 + (4+A) (16) 1 + (5+0) (16) 0 = = 3 (16) 3 + 1B (16) 2 + E (16) (16) 0 = = 4 (16) 3 + B (16) 2 + E (16) 1 + (5) (16) 0 = 4BE5 A to se rovná = = , takže srovnávací zkouška nám vyšla. Poznamenejme, že vlastně jde o obvyklý algoritmus pro sčítání, který známe z dekadické soustavy: 3 C F A 0 4 B E 5 S tím, že zde je 5+0=5, 4+A=E, C+F=1E a konečně 3+1=4. Když se podaří udržet pod kontrolu jiné významy stejného zápisu různých čísel v desítkové a šestnáctkové soustavě, je počítání v řádech šestnáctkové základu nakonec zvládnutelné. Poslední odstavce tohoto paragrafu věnujeme převodům mezi dvojkovou a šestnáctkovou soustavou. Na první pohled to může vzbuzovat dost strašidelná očekávání převádět čísla z jedné soustavy, ve které nejsme zvyklí běžně počítat, do jiné soustavy, ve které nejsme zvyklí počítat už vůbec, to nebudí zrovna příjemná očekávání. Skutečnost je ale docela zvládnutelná. Řády obou soustav jsou totiž vždy jenom mocniny dvojky u binární soustavy jsou to všechny mocniny základu z 2 = 2, u šestnáctkové jsou to mocniny základu z 16 = 16 = 2 4, to znamená mocniny, u kterých je exponent dělitelný čtyřmi. Bude nejlépe, když si postup ukážeme na příkladu. Příklad Začneme převodem čísla v šestnáctkové soustavě na tvar v binární soustavě. Například šestnáctkového čísla D6E (pošeptejme si tajně do ucha, že to v naší desítkové soustavě je = = 3438). Pro přehlednost začneme každou mocninou základu zvlášť. Poznamenejme, že v následujících odvozeních jsou čísla i číslice ze šestnáctkové (případně dvojkové) soustavy tištěny tučně D 16 2 = = ( ) 16 2 = ( ) 2 8 = , = = (4 + 2) 16 = ( ) 2 4 = , E 16 0 = = ( ) 2 0 = ( ) 1 = Když použijeme předchozí částečné rozpisy šestnáctkové soustavy na řády dvojkové soustavy, dostaneme D6E = D E 16 0 = , A to ve dvojkové soustavě odpovídá číslu Pro kontrolu, je to = Převod opačným směrem, od dvojkové soustavy k šestnáctkové, je také dost názorný

48 Příklad Tentokrát předpokládejme, že máme dáno číslo, zapsané ve dvojkové soustavě, , a pokusíme se ho převést do šestnáctkové soustavy. Aby se nám v podstatě stejné symboly číslic v různých soustavách nepletly, zachováme stejné značení jako v předchozím příkladu. Napřed rozložíme zadané číslo na součet mocnin základu z 2 = = Při převodu na šestnáctkovou soustavu musíme tento rozpis převést do tvaru, ve kterém budou jenom mocniny dvojky s exponentem dělitelným čtyřmi. V našem případě tedy jde o mocniny 2 8, 2 4 a 2 0. Mohou se v něm ale vyskytnout častěji než nejvýše jednou (ale ne častěji než patnáctkrát). Začneme mocninou 2 8. Sama o sobě v našem rozpisu shodou okolností není, je v něm ale mocnina 2 9, takže máme první sčítanec našeho nového rozkladu 2 9 = = 2 (16) 2 Budeme pokračovat čtvrtou mocninou, 2 4. Ta v rozkladu je a všimneme si, že kromě ní je v rozkladu ještě mocnina 2 6, kterou jsme také zatím nezpracovali (protože nebyla dost vysoká). Dva členy dvojkového zápisu, kterými se nyní zabýváme, můžeme snadno přepsat následujícím způsobem = = = 5 (16) 1. Zbývají poslední tři členy rozpisu dvojkového čísla na součty mocnin dvojky. Jsou to mocniny s exponentem menším než 4 a ne menším než 0. V našem případě se jedná o mocniny 2 3,2 2 a 2 0. Podobně jako v předchozích případech je převedeme na násobky nulté mocniny základu z 2 = 2, = = = 13 (16) 0. Tím jsme číslo ve dvojkové soustavě rozložili na kombinaci mocnin šestnáctky, jinak řečeno, mocnin základu šestnáctkové soustavy z 16 = 16. Práce na převodu čísla z dvojkové do šestnáctkové soustavy je skoro hotova. Zbývá jen spojit výsledky dosavadních kroků do jednoho celku: = = = 2 (16) (16) (16) 0 = 2 (16) (16) 1 + D (16) 0 = 25D. 7.B Zdroj informace Poté, co jsme se seznámili s nosičem informace daty a s jejich strukturami, si řekneme to nejzákladnější o tom, co informaci do komunikačního systémy vysílá. Je to zdroj informace. Informace mohou vznikat v různých prostředích, mohou mít různý účel a mohou být různým způsobem strukturovány. Proto mohou být i jejich zdroje hodně různé. My se tady omezíme jen na určitý typ zdrojů na ty, ve kterých mají informace charakter dat uspořádaných do posloupností znaků nějaké abecedy. Než si řekneme trochu víc o některých významných typech zdrojů, ukážeme si, jaké nejobecnější vlastnosti by měly zdroje, kterými se tady zabýváme, splňovat. Není jich mnoho a v podstatě jen odrážejí situaci, do které je zdroj informací zasazen. Nejprve si představme, jak taková situace vypadá. Existuje nějaký postup (ať už je to technické zařízení, jedinec, pokus v laboratoři, nebo něco jiného), který má k dispozici sadu znaků už jsme si zvykli říkat té sadě abeceda a budeme se toho držet. Z abecedy jsou postupně vybírány znaky, sestavuje se z nich zpráva, což je nějaká konečná, ale teoreticky neomezená posloupnost, a ta se odesílá příjemci. Tak vypadá zdroj zpráv z hlediska odesilatele

49 Teď se na tentýž zdroj zpráv podíváme z hlediska jejich příjemce. K tomu přichází posloupnost znaků zpráva a on z ní získává nějakou informaci. Z jeho úzkého pohledu se zpráva chová chaoticky. On, teoreticky vzato, neví, jaký bude příští znak právě přijímané zprávy, i když se to může z nejrůznějších důvodů domnívat s větší či menší dávkou jistoty. Základní představa, kterou jsme právě formulovali, má své historické kořeny. I když byla Shannonova a Weaverova teorie informace publikována až po válce, pracovali na ní v jejím průběhu a problém, který v Bellových telefonních laboratořích řešili, byl: jak zajistit přenos šifrovaných zpráv v podmínkách, kdy byla kvalita přenosu narušována šumem. Šifrovaná zpráva se, z hlediska příjemce, opravdu jeví jako nesmyslná posloupnost znaků, které bez další úpravy (dekódování a dešifrování) nerozumí a musí se tedy zajímat o příjem každého jednotlivého znaku zvlášť. Povšimněte si ale, že ani z hlediska odesilatele, který zpravidla znal faktický obsah zprávy 6, vůbec není v tomto modelu řeč o tom, co zpráva vlastně oznamuje, v čem zvětšuje znalosti příjemce. Tak, jak Shannon teorii informace vytvořil, je jenom o posloupnostech znaků. Přitom, jak si ještě postupně uvědomíme, její základní metody a základní principy umožňují celou teorii na práci s informacemi v tradičním smyslu snadno rozšířit. V následujících podkapitolách se na právě popsanou situaci podíváme s potřebnou (tedy minimální možnou) dávkou matematického formalismu. 7.B.1 Formální model zdroje V této podkapitole se seznámíme se Shannonovým modelem zdroje informace. Připomeňme si, že odráží spíš pohled příjemce zpráv. Je to logické a celkem přirozené příjemce je ten, jehož znalosti má informace, vyslaná zdrojem, zvětšit. Připomeňme si také to, co jsme si řekli o několik řádek výše příjemce vnímá přijímanou zprávu jako posloupnost znaků, kterou může považovat za chaotickou, přesněji řečeno, za náhodnou a jen výjimečně je schopen s jistotou předem říci, který znak bude následovat. Nuže, v takovém případě je zdroj informace definován jako dvojice, tvořená abecedou A a nějakým rozložením pravděpodobností p na této abecedě. Tedy dvojicí ( A, p ). Každá zpráva je pak oboustranně neomezená posloupnost znaků, x -2, x -1, x 0, x 1, x 2,, x n-1, x n, x n+1, A je možné ji považovat za realizaci náhodného procesu definovaného abecedou A a rozložením pravděpodobností p. Příjemce může disponovat i širší znalostí zdroje, především náhodnosti jeho generování znaků, tím, že kromě samotných pravděpodobností jednotlivých znaků zná i jejich podmíněné pravděpodobnosti. Jsou-li y 1, y 2, y 3, y 4, znaky abecedy A, pak můžeme předpokládat (alespoň teoreticky), že příjemce zná nejen pravděpodobnost p(y n = x), že n-tý znak zprávy bude x, ale i podmíněné pravděpodobnosti p(y n = x y n-1 ), p(y n = x y n-1, y n-2 ), p(y n = x y n-1, y n-2, y n-3 ),, toho, že příští znak bude x za podmínky, že poslední znak před ním byl y n-1, že poslední dva znaky před x byly y, y, nebo že poslední tři znaky před x byly y, y, y, a tak dál. n-1 n-2 n-1 n-2 n-3 Poznámka 7.27 Znalost pravděpodobností se v praktické informační komunikaci získává statistickou analýzou dosavadních textů s využitím zákona velkých čísel. Abychom se na výsledky statistické analýzy mohli dost spolehnout, je nutné analyzovat poměrně dlouhé úseky dosavadních zpráv dokonce i v případech, kdy chceme statisticky odhadnout původní jednoduché 6 Slovo zpravidla má svůj důvod. Radista na bitevní lodi, který morseovkou vyklepával zprávy svého kapitána, je obvykle dostával už v šifrovaném tvaru a ani on nevěděl, co mají obsahovat

50 pravděpodobnosti p(x). Rozsah analyzovaných testů rychle roste s každým prodloužením úseku podmiňující části zprávy. Navíc musíme spoléhat na to, že statistické vlastnosti přijímaných textů jsou dostatečně stabilní, aby vůbec mělo smysl dlouhé úseky studovat. Abychom si udělali představu. Z podkapitoly o Morseově abecedě už víme, že angličtina má (včetně mezery) 27 znaků. Tomu musí odpovídat délka textu, ve kterém musíme spočítat jejich četnost a odhadnout tak příslušné pravděpodobnosti. Chceme-li hledat podmíněné pravděpodobnosti s jedním znakem v podmínce, musíme zkoumat četnost všech dvojic znaků těch je 729. Pro odhad podmíněných pravděpodobností se dvěma znaky v podmínce musíme zjistit četnost všech trojic, kterých je Pro podmíněné pravděpodobnosti se čtyřmi znaky v podmínce už analyzujeme výskyt pětic znaků a těch je Text, který bychom měli statisticky zpracovat, by pak měl mít i při použití pokročilých a hlavně citlivých statistických postupů, řekněme, něco kolem znaků. Jen pro hrubou představu, je to přes pět milionů normostránek, tj. více než deset tisíc pětisetstránkových knih. Pokud bychom potřebovali ještě další argument pro výhodnost binární abecedy, tady máme argument navíc. Při zjišťování podmíněných pravděpodobností s podmínkou dlouhou celých deset znaků (nul a jedniček) bychom potřebovali zkoumat četnosti pouhých jedenáctičlenných skupin znaků a to už se dá zvládnout. Vraťme se ale ke zdroji informace a jeho charakteristikám. Pokud známe podmíněné pravděpodobnosti dostatečné délky, umíme snadno spočítat i sdružené pravděpodobnosti konečných skupin znaků (jinými slovy, zpráv). Stačí, když si vzpomeneme na vzorec pro sdružené pravděpodobnosti v sekci 1.C.2 a přeložíme si ho do symboliky, kterou jsme zvolili pro zdroje informace: a tak dál. p(y n = x, y n-1 ) = p(y n = x y n-1 ). p(y n-1 ), p(y n = x, y n-1, y n-2 ) = p(y n = x y n-1, y n-2 ) p(y 1 y 2 ). p( y 2 ), Víme tedy už, co je pro nás zdroj informace a můžeme se zabývat jeho vlastnostmi, především ale vlastnostmi informace, kterou zdroj vysílá k příjemci zpráv. 7.B.2 Simulace zdrojů informace Někomu to může připadat nepravděpodobné, je to ale tak celkem jednoduchá reprezentace zdroje informace pouhou abecedou a pravděpodobnostmi znaků, zejména když do nich zahrneme i pravděpodobnosti podmíněné, reprezentuje zdroj zpráv velmi dobře. Dokonce tak dobře, že nám umožňuje pomocí náhodných simulací jeho emisi zpráv napodobovat a velmi dobré výsledky dostáváme i tehdy, když při simulaci použijeme podmíněné pravděpodobnosti s poměrně krátkými podmínkami zahrnujícími jen několik znaků. Když si vybavíme podkapitolu 1.C přesněji, její sekci 1.C.3, snadno si ověříme, že zdroj informace, tak jak jsme ho definovali, je vlastně totéž jako náhodný proces a každá zpráva je realizace tohoto náhodného procesu. Realizace, které vzniknou náhodnou simulací příslušného procesu- -zdroje, pak jsou z pohledu teorie informace k nerozeznání od skutečných zpráv. I když z pohledu lingvisty, který je bude číst se slovníkem v ruce, nedávají vůbec žádný smysl. V padesátých letech dvacátého století, v době, kdy teorie informace byla exotickou novinkou, vzniklo poměrně hodně simulací reálných jazyků nebo jiných generátorů zpráv a při jejich rozboru se ukázaly jejich některé, do té doby neznámé, vlastnosti. Několik si jich tady ukážeme. Nejen pro zajímavost, ale hlavně proto, že se nám budou v následujících kapitolách hodit jako názorné ilustrace teoretických závěrů

51 7.B.2.1 Malí zelení mužíčci Pod poněkud fantastickým názvem se uvádí reálná příhoda z poměrně nedávné historie radioastronomie. To je obor astronomie, který pomocí komplikovaných a hlavně rozlehlých anténních systémů sleduje rádiové záření z hvězd doslova z hvězd, protože ty jsou přirozeným zdrojem rádiového záření. V roce 1967 vyhodnocovala doktorandka university v Cambridgi Jocelyn Bellová (protože se později vdala, je známější jako Jocelyn Bell Burnellová) záznamy přijímaných signálů a zarazila ji dlouhá série krátkých záblesků, které se pravidelně opakovaly. Přivolala svého školitele Anthonyho Hawishe a společně začali signály zkoumat. To, že radiový signál z vesmíru pravidelně kolísá, nebylo nic překvapivého. Znamená to, že ve směru na který míří anténa je na povrchu hvězdy silný zdroj záření, který se s jejím otáčením vynořuje a zapadá. Druhá možnost je, že hvězdu obíhá zrovna ve směru k naší Zemi planeta, která ji pravidelně částečně zakrývá. Šokující bylo to, že se záblesky objevily třicetkrát za vteřinu a to se zdálo být na rotaci hvězdy trochu moc rychlé. Tehdy bylo zrovna jedno z těch období, ve kterých mají romantici řadu báječných nápadů o kosmických civilizacích a důležitých zprávách z vesmíru a tak není divu, že oběma astronomům táhly hlavou i dost divoké nápady. Naštěstí byli oba, učitel i jeho žačka, uvážliví lidé a o svém zjištění referovali střízlivě jako o zvláštním a dosud neznámém typu pulsaru (pulsující hvězdy). Nápad o zprávě z vesmíru prohodili jen žertem. Udělali dobře, o několik let později astrofyzikové a kosmologové spočítali, že tak rychlý sled impulsů je možný, pokud se jedná o neutronovou hvězdu ze supertěžké hmoty nestrukturované na atomy, ale složené jenom z hustě nakupených jader. Oba objevitelé byli později oceněni Nobelovou cenou za fyziku a jediné, co z jejich váhání zůstalo, je zkratka LGM (Little Green Men Malí zelení mužíčci) pod kterou jsou superrychlé pulsary s periodou impulsu v délce mikrosekund až sekund evidovány. Až dosud by se to tématu naší kapitoly příliš netýkalo. Nicméně, teorie informace vstoupila do hry v době, kdy se o neutronových hvězdách ještě nevědělo a jev skutečně byl záhadou, pro kterou se hledala možná i nemožná vysvětlení. Je možné, aby zdroj takového vysílání byl skutečně zdrojem zpráv (nesoucích přeci jenom víc informace než jenom tu, že tady je něco co bliká )? Pak by takový zdroj aktivně používal abecedu o jednom jediném znaku (rozdíly se nenašly ani v signálech, ani v pauzách mezi nimi). Takový znak tedy má pravděpodobnost rovnou 1 a každý jeho nový výskyt nepřináší nic nového. Případná zpráva tedy není o ničem. Taková zpráva se zdála být i romantikům poměrně velkým přepychem a tak se obecný názor mezi vědci rychle ustálil na závěru, že se o zprávu od malých zelených mužíčků jednat nemůže. Poznámka Pro nás je v celé příhodě s LGM-pulsary jedno dost důležité poučení. Nejistota o vysílaných signálech, plynoucí z jejich náhodnosti (ať už skutečné, nebo jen dané naší neznalostí), není vada. Právě její odstraňování tím, že zprávu přijímáme a dozvídáme se jak se signály skutečně vyvíjejí je to, co nese informaci. Zapamatujme si to odstraňování nejistoty je to, nač se musíme při zkoumání zpráv, informace a jejích zdrojů soustředit. 7.B.2.2 Simulace běžných jazyků Když se v padesátých letech dvacátého století začala intenzivně rozvíjet teorie informace, bylo docela žádoucí ověřit, zda její pojmy mají oporu v realitě. V případě zdroje zpráv, zda se také to, co jako zdroj definujeme, skutečně chová jako obvyklé známé zdroje zpráv. Existující běžné jazyky se k tomu účelu skvěle hodily. Jednak tím, že je lidé mají se sdělováním informací přirozeně spojeny, a pak také tím, že pro zjišťování potřebných pravděpodobností jednotlivých písmen existuje v knihách dost podkladů. Postupně byly pro známé jazyky popsány jejich abecedy (to nebyl žádný problém, šlo jen o to, zda do nich zahrnout třeba i číslice) a pravděpodobnosti výskytu písmen. Ty se daly odhadnout statistickými metodami z relativních četností. Brzy se ukázalo, že je velmi užitečné znát také podmíněné pravděpodobnosti výskytu jednotlivých písmen za podmínky, že jim předchází další jedno, nebo dvě, nebo případně několik dalších písmen. Při zjišťování podmíněných pravděpodobností je shromáždění a zpracování dostatečně bohatého materiálu obtížné (viz úvodní odstavce této kapitoly), ale v zásadě to jde a zkušenost ukázala, že podmínky dlouhé kolem pěti nebo sedmi písmen už dávají přijatelné výsledky

52 Když je přesně známa abeceda a pravděpodobnosti, je celkem snadné generovat s jejich pomocí náhodnou posloupnost písmen a podívat se, zda nám něčím nepřipomíná typické jevy příslušného jazyka i když lexikální smysl vzniklá slova skoro nikdy nemají. Podíváme se, jak dopadla simulace češtiny. Z Tabulky 9 známe relativní četnosti (v podstatě pravděpodobnosti výskytu) jednotlivých znaků češtiny. Těch znaků je, včetně mezery, 41 (ú a ů jsme tam považovali za jeden znak). Odhady pravděpodobností jsou, samozřejmě, pro nezávislý výskyt jinými slovy, nejsou to podmíněné pravděpodobnosti. Kdybychom chtěli sestavit podobnou tabulku pro pravděpodobnosti znaků podmíněné jiným znakem, obsahovala by celkem položek a to už by bylo dost nepřehledné. Nicméně takové tabulky existují a jsou v archivech lingvistů dosažitelné. Je zřejmé, že se dá snadno ověřit, že už podmíněné pravděpodobnosti s podmínkou pokrývající jen jeden předchozí znak se budou podstatně lišit od těch nepodmíněných. Ukažme si to na hlásce (znaku) p. Nepodmíněná pravděpodobnost písmene p není v češtině nijak vysoká, je 0,027. Pravděpodobnost téhož písmene, za podmínky, že mu bezprostředně předchází znak (obvykle se tak značí mezera ), jinými slovy, pravděpodobnost, že p je prvním písmenem slova, je už 0,0866. A naopak, pravděpodobnost, že p bude bezprostředně následovat za znakem ž je prakticky nulová (slovo natožpak je nejspíš jediné, kde to může nastat). Ale vraťme se k naší simulaci. Začneme nejjednodušším případem, ve kterém budeme předpokládat, že jsou všechny znaky našeho jazyka stejně pravděpodobné. Mají tedy všechny pravděpodobnost p* = 0,0244. Lingvisté už provedli příslušnou simulaci a při náhodném výběru českých písmen se stejnými pravděpodobnostmi dostali text: ŤŽUP ÚHCQSCAŇFÝÉČBNYZNCĎD ČUÉKUCYÝČUEWÁŃJWÚMZCO. Češtinář by z něj jistě radost neměl. Zkusme to tedy raději se skutečnými pravděpodobnostmi znaků z Tabulky 9. Tentokrát vyšla simulace přeci jen o poznání lépe, i když výsledek pořád ještě češtinu nepřipomíná. AMNSTBSIOTY TZ VRNČILD UŘZNLYKAVĚ OCHUOON. Výsledek podobného pokusu s podmíněnými pravděpodobnostmi s délkou podmínky omezenou na jedno předchozí písmeno se mi nepodařilo získat, takže přeskočíme rovnou na podmíněné pravděpodobnosti s podmínkami zahrnujícími dvě písmena. Při realizaci příslušné simulace vyšlo VNELANĚKUM KTE POU SNEL HODĚ NINENDA. Pravda, česká slova to nejsou, ale celkový pocit z takového umělého textu už by mohl někoho přimět, aby pro jistotu sáhl po slovníku. Pro češtinu se mi nepodařilo najít podobné simulace pro podmíněné pravděpodobnosti se třemi nebo více písmeny v podmínce. Pro úplnost proto uvádím výsledky podobného pokusu pro ruštinu. Při simulaci s pravděpodobnostmi podmíněnými třemi předchozími písmeny tam vyšel text, který v azbuce vypadá takto ВЕСЕЛ БРАТЬСЯ НЕ СУХОМ И НЕПО И КОРКО. Pro ty, kteří už nezažili ruštinu, přepíšeme vzniklý text do latinky. Zní VESEL BRAŤSJA NĚ SUCHOM I NĚPO I KORKO. Skoro by to člověk za ruštinu považoval, i když ta slova (kromě I a NĚ) by v ruském slovníku nenašel

53 7.B.2.4 Simulace hudby Zkoumání informačních zdrojů, které produkují hudební slova a věty budilo svého času dost velký zájem. Zdálo se, že by mohlo hrát roli i při ověřování autenticity, nalezení specifického hudebního jazyka různých skladatelů nebo stylů a podobně. Pokusy o simulaci hudby probíhaly hlavně začátkem padesátých let, a i když byly výsledky zajímavé, nepřinesly to, co se od nich očekávalo. Nejvýznamnější příčiny byly dvě. První souvisela s definicí abecedy. V hudbě ji netvoří jenom noty, ale také rytmus, styl přednesu, dynamika hry a podobné znaky. Ty nemají charakter typických znaků abecedy s pevným umístěním v textu zprávy a obvykle bylo nutné je k vytvořené posloupnosti not dodatečně doplnit. Druhá příčina pak spočívala v nedostatku statistických podkladů pro zjišťování pravděpodobností not, zejména pokud se jednalo o podmíněné pravděpodobnosti s delší podmínkou. Hudebních partitur převedených do digitální formy je přeci jenom o poznání méně než knih. Obr. 8. Simulovaná notová partitura. Pro n=1, byly noty generovány s nepodmíněnými pravděpodobnostmi, pro n=2 se sdruženými pravděpodobnostmi dvou znaků, pro n=4 se sdruženými pravděpodobnostmi 4 znaků, atd. Generování postupovalo po jednom znaku a skupiny předchozích znaků se překrývaly

Zobrazit více