Informace, kódování a redundance



Podobné dokumenty
Informace, kódování a redundance

Teorie informace Obsah. Kybernetika. Radim Farana Podklady pro výuku

Kódy pro detekci a opravu chyb. INP 2008 FIT VUT v Brně

Teorie informace Obsah. Kybernetika. Radim Farana Podklady pro výuku

Vnitřní reprezentace dat

Aplikovaná informatika. Podklady předmětu Aplikovaná informatika pro akademický rok 2013/2014 Radim Farana. Obsah. Kybernetika

Základy číslicové techniky z, zk

Automatizační technika. Obsah

Zobrazení dat Cíl kapitoly:

Y36SAP - aritmetika. Osnova

ZÁKLADY INFORMATIKY 14ZINF. Číselné soustavy

Střední odborná škola a Střední odborné učiliště, Dubno Ing. Miroslav Krýdl Tematická oblast ELEKTRONIKA

Základní pojmy. Program: Algoritmus zapsaný v programovacím jazyce, který řeší nějaký konkrétní úkol. Jedná se o posloupnost instrukcí.

Data v počítači. Informační data. Logické hodnoty. Znakové hodnoty

1. Základy teorie přenosu informací

Úvod do teorie informace

Metody odvozování. matematická východiska: logika, Prolog

3 Jednoduché datové typy Interpretace čísel v paměti počítače Problémy s matematickými operacemi 5

Kódy pro odstranění redundance, pro zabezpečení proti chybám. Demonstrační cvičení 5 INP

Architektura počítačů Logické obvody

Architektura počítačů Logické obvody

Zabezpečení datových přenosů pomocí CRC

Disková pole (RAID) 1

Kódováni dat. Kódy používané pro strojové operace

7. Relační a prezentační vrstva

Kódování signálu. Problémy při návrhu linkové úrovně. Úvod do počítačových sítí. Linková úroveň

Informace v počítači. Výpočetní technika I. Ing. Pavel Haluza ústav informatiky PEF MENDELU v Brně haluza@mendelu.cz

Kapitola 10: Diskové a souborové struktury. Klasifikace fyzických médií. Fyzická média

Disková pole (RAID) 1

Osnova kurzu Elektrotechnika a elektronika

Osnova přednášky. Informace v počítači. Interpretace dat. Údaje, data. Úvod do teorie informace. Výpočetní technika I. Ochrana dat

Základní jednotky používané ve výpočetní technice

Pojem architektura je převzat z jiného oboru lidské činnosti, než počítače.

C2115 Praktický úvod do superpočítání

PSK2-5. Kanálové kódování. Chyby

Tato tematika je zpracována v Záznamy přednášek: str materiál: PrikladyZobrazeniCisel.pdf

Technické prostředky počítačové techniky

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

Dodatek č. 3 ke školnímu vzdělávacímu programu. Strojírenství. (platné znění k )

Architektura počítačů

Teorie informace a kódování (KMI/TIK)

Identifikátor materiálu: ICT-1-02

Komplexita a turbulence

Informační a komunikační technologie

ČÍSELNÉ SOUSTAVY PŘEVODY

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

1. ÚVODNÍ INFORMACE K PŘEDMĚTU. Vysoká škola technická a ekonomická v Českých Budějovicích. Institute of Technology And Business In České Budějovice

Informatika I - 5. doc. Ing. Jan Skrbek, Dr. KIN. Spojení: Ing. Bc. Marian Lamr INN

PA152: Efektivní využívání DB 2. Datová úložiště. Vlastislav Dohnal

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

Kódy a kódování dat. Binární (dvojkové) kódy. Kód Aikenův

Varianty zkouškových testů

Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.


Hardwarová realizace konečných automatů

Adresní mody procesoru

[1] samoopravné kódy: terminologie, princip

Úvod do informačních technologií

Nejvyšší řád čísla bit č. 7 bit č. 6 bit č.5 bit č. 4 bit č. 3 bit č. 2 bit č. 1 bit č. 0

7. Relační a prezentační vrstva

Matematická logika. Miroslav Kolařík

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Paměťové prvky. ITP Technika personálních počítačů. Zdeněk Kotásek Marcela Šimková Pavel Bartoš

09. seminář logika (úvod, výroková).notebook. November 30, Logika

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA. VZOR PŘIJÍMACÍ ZKOUŠKY DO NAVAZUJÍCÍHO STUDIA Obor: Manažerská informatika

Další aspekty architektur CISC a RISC Aktuálnost obsahu registru

Operační paměti počítačů PC

Počítač jako elektronické, Číslicové zařízení

CW01 - Teorie měření a regulace

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Co je ekonomie? Vždy je nutno rozhodnout se, kterou potřebu budeme uspokojovat a jakým způsobem. Tj. lidé vždy volí mezi alternativami.

Architektury CISC a RISC, uplatnění v personálních počítačích

Hardware. Příklad převodu čísla: =1*32+0*16+0*8+1*4+0*2+1*1= Převod z dvojkové na desítkovou Sčítání ve dvojkové soustavě

Charakteristika dalších verzí procesorů v PC

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

KET/ZPI - Zabezpečení podnikových informací

Základní škola Moravský Beroun, okres Olomouc

Základy informačních technologií. Základy práce s tabulkovým procesorem MS Excel Základy práce s počítačovou sítí Internet.

SYSTÉMOVÁ METODOLOGIE (VII) Kybernetika. Ak. rok 2011/2012 vbp 1

1. OBSAH, METODY A VÝZNAM FYZIKY -


3. Linková vrstva. Linková (spojová) vrstva. Počítačové sítě I. 1 (5) KST/IPS1. Studijní cíl

PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA

Grafické adaptéry a monitory

FYZIKA Charakteristika vyučovacího předmětu 2. stupeň

R10 F Y Z I K A M I K R O S V Ě T A. R10.1 Fotovoltaika

Reálná čísla a výrazy. Početní operace s reálnými čísly. Složitější úlohy se závorkami. Slovní úlohy. Číselné výrazy. Výrazy a mnohočleny

PROCESOR. Typy procesorů

1 Paměť a číselné soustavy

Principy činnosti sběrnic

VY_32_INOVACE_FY.01 FYZIKA - ZÁKLADNÍ POJMY

Principy počítačů I Reprezentace dat

uvedení do problematiky i Bezpečnostní kódy: detekční kódy = kódy zjišťující chyby samoopravné kódy = kódy opravující chyby příklady kódů:

K čemu je studentovi střední školy teoretická informatika?

STRUKTURA POČÍTAČŮ JIŘÍ HRONEK, JIŘÍ MAZURA KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO

Mgr. Ladislav Blahuta

Architektura počítače

PAMĚTI ROM, RAM, EPROM, EEPROM

Vyplňování souvislé oblasti

Nejvyšší řád čísla bit č. 7 bit č. 6 bit č.5 bit č. 4 bit č. 3 bit č. 2 bit č. 1 bit č. 0

Transkript:

Informace, kódování a redundance Data (jednotné číslo údaj) obvykle chápeme jako údaje, tj. číselné hodnoty, znaky, texty a další fakta zaznamenaná (a uložená v databázi) ve formě uspořádané posloupnosti znaků zvolené abecedy. Jedná se tedy o jakékoli vyjádření (reprezentaci) skutečnosti, schopné přenosu, uchování, interpretace či zpracování. Pojem informace patří k nejobecnějším kategoriím současné vědy i filozofie. Podle toho, v kterém vědním oboru nebo v které oblasti lidské činnosti se používá, jsou aplikovány specifické přístupy ke zkoumání informace a jsou k dispozici různé způsoby jejího definování V nejobecnějším slova smyslu se informací chápe údaj o reálném prostředí, o jeho stavu a procesech v něm probíhajících. Informace snižuje nebo odstraňuje neurčitost systému (např. příjemce informace); množství informace je dáno rozdílem mezi stavem neurčitosti systému (entropie ), kterou měl systém před přijetím informace a stavem neurčitosti, která se přijetím informace odstranila. V tomto smyslu může být informace považována jak za vlastnost organizované hmoty vyjadřující její hloubkovou strukturu (varietu), tak za produkt poznání fixovaný ve znakové podobě v informačních nosičích. V informační vědě a knihovnictví se informací rozumí především sdělení, komunikovatelný poznatek, který má význam pro příjemce nebo údaj usnadňující volbu mezi alternativními rozhodovacími možnostmi. Významné pro informační vědu je také pojetí informace jako psychofyziologického jevu a procesu, tedy jako součásti lidského vědomí (např. N. Wiener 2 definuje informaci jako "obsah toho, co se vymění s vnějším světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním"). V exaktní vědě se např. za informaci považuje sdělení, které vyhovuje přísným kriteriím logiky či příslušné vědy. V ekonomické vědě se informací rozumí sdělení, jehož výsledkem může být zisk nebo užitek. Znalost je to, co jednotlivec vlastní (ví) po osvojení dat a informací a po jejich začlenění do souvislostí. Znalost je tedy výsledek poznávacího procesu a předpoklad uvědomělé činnosti. Všimněme si rozdílu vycházejícího z rozboru rozhodovacího procesu, v němž expert vybavený znalostmi zvažuje data a informace relevantní pro daný problém. Znalosti expert získal vzděláním a zkušenostmi a vybraná data a informace se týkají konkrétní situace či případu. Komplexní poznání je pak možno považovat za množinu znalostí, informací a dat vztahujících se k určité problematice. Entropie je neurčitost, nejistota, neuspořádanost; střední hodnota míry informace potřebné k odstranění neurčitosti, která je dána konečným počtem vzájemně se vylučujících jevů. 2 Norbert Wiener (26..894-8.3.964) - americký matematik, zakladatel kybernetiky. Zabýval se matematickou analýzou, teorií pravděpodobnosti, matematickou statistikou a výpočetní technikou. Je spoluautorem teorie podobnosti činnosti nervové soustavy a počítače, základu neurokybernetiky. - -

Vzdělání Zkušenost Data Znalosti Informace Rozhodování Počítač (výpočetní systém) je stroj na automatické ukládání, zpracovávání, zpřístupňování a přenos dat (automatizuje informační činnosti). Jednotky informace V oblasti výpočetní techniky se za informaci považuje kvantitativní vyjádření obsahu zprávy. Za jednotku informace se ve výpočetní technice považuje rozhodnutí mezi dvěma alternativami a vyjadřuje se jednotkou nazvanou bit (binary digit). Informace velikosti jednoho bitu může nabývat hodnot: ANO (true) NE (false) Bitu odpovídají hodnoty = ANO, 0 = NE v dvojkové (binární) soustavě. Téměř všechny současné počítače pracují v binární soustavě. Technicky je totiž relativně snadné reprezentovat dva rozdílné stavy, např. úrovní elektrického napětí. Bit je dále nedělitelný. BYTE (čti bajt) = 8 bitů (256 možností) binárně vyjádřená čísla 0 255 Pokusy o český ekvivalent (slabika?, znak?) byly neúspěšné Půlbyte 4 bity (6 možností) číslice v šestnáctkové (hexadecimální) soustavě. Byte je pak vyjádřen dvojicí šestnáctkových číslic {0,,2,3,4,5,6,7,8,9,A=0,B=,C=2,D=3,E=4,F=5} Značení: b = bit (čti bit) B = byte (čti bajt) SLOVO podle typu počítače většinou 2 nebo 4 byty Byty v 4-bytovém slově mohou být číslována od 0 do 3 buď zleva doprava nebo zprava doleva. Big endian zleva doprava 0 2 3 IBM, SPARK, MOTOROLA - 2 -

Little endian 3 2 0 zprava doleva INTEL (Pentium) Násobky jednotek (předpony z latiny) Předpona Značení Fyzikální jednotky Informatické jednotky kilo- k 0 3 =.000 2 0 =.024 mega- M 0 6 =.000.000 2 20 =.048.576 giga- G 0 9 2 30 tera- T 0 2 2 40 Zlomky (předpony z řečtiny) mili-, mikro-, piko-, užívané pro fyzikální jednotky, například pro čas a vzdálenost, nemají pro informatické jednotky smysl. Kódování a redundance dat Při ukládání, zpracování a přenosu dat je nutným požadavkem SPOLEHLIVOST Jeden z prostředků dosažení spolehlivosti je REDUNDANCE = NADBYTEČNOST dat Data jsou v počítači kódována Kód prosté (vzájemně jednoznačné) zobrazení množiny kódovaných objektů {O j } do množiny kódových slov {K j } (v informatice obvykle posloupností 0 a ) {O j } {K j = k(o j )}, O i O j k(o i ) k(o j ) Hammingova vzdálenost Hammingova vzdálenost kódových slov X = (x, x 2,, x n ) a Y = (y, y 2,, y n ) počet míst, na kterých se kódová slova liší z d = 3 00 0 d n ( X, Y ) = i= x i y i 0 000 00 00 0 y x - 3 -

Minimální Hammingova vzdálenost kódu K nejmenší ze vzdáleností všech dvojic různých kódových slov d min = min X Y K d(x,y) Poznámka: Hammingova vzdálenost tvoří z množiny kódových slov metrický prostor = množina se vzdáleností d pro kterou platí: d(x,y) 0 a d(x,y) = 0 pouze když x = y d(x,y) = d(y,x) pro každé x a y d(x,y) d(x,z) + d(z,y) pro každé x, y, z Typy kódů podle úrovně zabezpečení Zabezpečující kód při změně jednoho bitu (z 0 na nebo z na 0) nemůže dojít k záměně za jiné kódové slovo (chyba v d min bitech se detekuje). d min 2 pokud dojde k chybě ve více bitech, může k záměně dojít Samoopravný kód (single error corected - SEC kód) při změně jednoho bitu (z 0 na nebo z na 0) nemůže dojít k záměně za jiné kódové slovo a lze určit, které slovo bylo pokaženo (chyba ve (d min ) div 2 se oprav d min 3 pokud dojde k chybě ve dvou a více bitech, může dojít k chybné opravě SEC DED kód (single error corrected, double error detected) chyba v jednom bitu se opraví, chyba ve dvou bitech se detekuje. Kódy s vyšší úrovní zabezpečení detekují, případně jsou schopné opravit i chyby ve více bitech dané jednotky dat. Vyžadují větší redundanci. Konstrukce zabezpečujícího kódu Zabezpečující kód lze získat přidáním jednoho paritního bitu, tak aby počet jedniček byl buď sudý = sudá parita (x,, x n ) (x,, x n, x n+ ), n+ xi = 0, xn+ = x x... 2 i= x nebo lichý = lichá parita (x,, x n ) (x,, x n, x n+ ), n+ i= x i = +, xn = x x2... x n n Zabezpečující kód získáme za cenu redundance jediného bitu. - 4 -

Funkce XOR Funkce = XOR = non exclusive OR = vylučující nebo = antiekvivalence Dává hodnotu = TRUE když jeden a jen jeden argument je = TRUE 0 = FALSE když jsou oba argumenty 0 = FALSE nebo oba argumenty = TRUE Pravdivostní tabulka funkce: A B A B 0 0 0 0 0 0 Redundance pro samoopravný (SEC) kód Odvození: binární kód délky m bitů minimální Hammingova vzdálenost rovna. umožní kódovat 2 m slov. Doplňme k bitů s požadavkem, aby kód délky m+k byl již zabezpečující. to dává 2 m+k možností. V okolí každého z 2 m použitých je m+k zakázaných (ty totiž mají Hammingovu vzdálenost ). - 5 -

Obecně pro opravu k chyb v jednom slově je třeba aby: d min = 2 k + Jinými slovy: Automaticky lze vždy opravit současně [(d min )/2] chyb, kde [ ] označuje celou část čísla Čím delší úsek dat zabezpečujeme jako celek, tím menší je procentuální nadbytečnost kódu a tedy lepší využití paměti. ALE (něco za něco, aneb krajíc chleba má dvě strany) Čím delší úsek dat zabezpečujeme jako celek, tím větší je pravděpodobnost, že v tomto úseku dojde k více než jedné chybě. Ke získání SEC-DED stačí doplnit při d min = 3 jediný paritní bit celkové parity. Pak se chyba ve dvou bitech detekuje (ale neopraví). Příklad konstrukce SEC kódu Je dán 8-bitový kód s d min =, je třeba jej rozšířit na samoopravný kód s d min 3 d d 2 d 3 d 4 d 5 d 6 d 7 d 8 p p 2 p 3 p 4 uspořádáno: p p 2 d p 3 d 2 d 3 d 4 p 4 d 5 d 6 d 7 d 8 p = d d 2 d 4 d 5 d 7, p 2 = d d 3 d 4 d 6 d 7, p 3 = d 2 d 3 d 4 d 8, p 4 = d 5 d 6 d 7 d 8-6 -

K datovým bitům d... d 8 generuje generátor parity paritní bity p... p 4 d d 8 generátor parity p p 4 hlavní paměť generátor parity p p 4 d d 8 korektor oprava p p 4 komparátor s 4 s 3 s 2 s s s 4 Komparátor stanoví příznaky (syndromy): s = p p s 3 = p 3 p 3 s 2 = p 2 p 2 s 4 = p 4 p 4 Korektor poté provede opravu chybného bitu, přičemž postupuje takto: všechny syndromy jsou 0 žádná chyba detekována, korekce se neprovádí. pouze jeden syndrom je chyba je pouze v paritním bytu, oprava není nutná. více bitů má syndrom mohlo dojít k chybě v datovém bitu, je třeba změnit na opačný bit s pořadím s 4 s 3 s 2 s. Při dvou chybách však opraví špatně! SEC DED se získá doplněním dalšího paritního bitu V praxi se dnes užívá nejčastěji SEC DED 64+8 nebo 32+7 Nadbytečnost dat pro zabezpečení kódu je u současných počítačů pro uživatele zcela NEVIDITELNÁ Uživatel ani autor programu se o ní nemusí starat vnitřní úroveň zabezpečení na úrovni kódu Globální úroveň zabezpečení = zálohování dat pro případ poruchy systému uživatel i programátor musí zajistit - 7 -