Informatika Datové formáty



Podobné dokumenty
Aplikovaná informatika. Podklady předmětu Aplikovaná informatika pro akademický rok 2006/2007 Radim Farana. Obsah. Obsah předmětu

3 Jednoduché datové typy Interpretace čísel v paměti počítače Problémy s matematickými operacemi 5

Data v počítači. Informační data. Logické hodnoty. Znakové hodnoty

Algoritmy a datové struktury

Algoritmy I. Číselné soustavy přečíst!!! ALGI 2018/19

Jak v Javě primitivní datové typy a jejich reprezentace. BD6B36PJV 002 Fakulta elektrotechnická České vysoké učení technické

Datové formáty Obsah. Datové formáty (datové typy) Radim Farana Podklady pro výuku

Číselné soustavy. Ve světě počítačů se využívají tři základní soustavy:

Čísla a číselné soustavy.

Principy počítačů I Reprezentace dat

Mikroprocesorová technika (BMPT)

Číselné soustavy v mikroprocesorové technice Mikroprocesorová technika a embedded systémy

Technická kybernetika. Obsah. Principy zobrazení, sběru a uchování dat. Měřicí řetězec. Principy zobrazení, sběru a uchování dat

Ahoj mami. Uložení dat v počítači. Příklady kódování dat. IAJCE Přednáška č. 4

Základní principy zobrazení čísla Celá čísla s pevnou řádovou čárkou Zobrazení reálných čísel Aritmetika s binárními čísly

Algoritmizace a programování

Fz =a z + a z +...+a z +a z =

Základní jednotky používané ve výpočetní technice

1.1 Struktura programu v Pascalu Vstup a výstup Operátory a některé matematické funkce 5

Datové typy a jejich reprezentace v počítači.

v aritmetické jednotce počíta

Číselné soustavy. Binární číselná soustava

ČÍSELNÉ SOUSTAVY PŘEVODY

PJC Cvičení #2. Číselné soustavy a binární reprezentace proměnných

Digitální signály a kódy

Struktura a architektura počítačů (BI-SAP) 5

Proměnná. Datový typ. IAJCE Cvičení č. 3. Pojmenované místo v paměti sloužící pro uložení hodnoty.

Čísla v počítači Výpočetní technika I

Přednáška 2: Čísla v počítači. Práce s počítačem. Číselné soustavy. Převody mezi soustavami. Aritmetické operace. Uložení čísel v paměti počítače

Reprezentace dat v informačních systémech. Jaroslav Šmarda

Architektury počítačů

Kódováni dat. Kódy používané pro strojové operace

Principy počítačů. Prof. RNDr. Peter Mikulecký, PhD.

Y36SAP. Osnova. Číselné soustavy a kódy, převody, aritmetické operace Y36SAP Poziční číselné soustavy a převody.

4 Datové struktury. Datové struktury. Zobrazení dat v počítači

Program převod z desítkové na dvojkovou soustavu: /* Prevod desitkove na binarni */ #include <stdio.h>

Čísla v plovoucířádovéčárce. INP 2008 FIT VUT v Brně

Číselné soustavy. Prvopočátky. Starověký Egypt a Mezopotámie. Již staří Římané

Struktura a architektura počítačů (BI-SAP) 6

Aritmetické operace a obvody pro jejich realizaci

Převody mezi číselnými soustavami

Tato tematika je zpracována v Záznamy přednášek: str materiál: PrikladyZobrazeniCisel.pdf

PB002 Základy informačních technologií

Nejvyšší řád čísla bit č. 7 bit č. 6 bit č.5 bit č. 4 bit č. 3 bit č. 2 bit č. 1 bit č. 0

E. Pohyblivářádováčárka

Nejvyšší řád čísla bit č. 7 bit č. 6 bit č.5 bit č. 4 bit č. 3 bit č. 2 bit č. 1 bit č. 0

Formátové specifikace formátovací řetězce

1. Chyby vstupních dat metody převedení úlohy na numerickou (řád použité metody) zaokrouhlovací reprezentace čísel v počítači

C2115 Praktický úvod do superpočítání

Vnitřní reprezentace dat

Pokud není uvedeno jinak, uvedený materiál je z vlastních zdrojů autora

Kódy a kódování dat. Binární (dvojkové) kódy. Kód Aikenův

- speciální symboly + - * / =., < > <> <= >= a další. Klíčová slova jsou chráněnými útvary, které nelze použít ve významu identifikátorů.

Formátová specifikace má tvar (některé sekce nemají smysl pro načítání) %

BI-PA1 Programování a algoritmizace 1 Katedra teoretické informatiky

BI-PA1 Programování a algoritmizace 1, ZS Katedra teoretické informatiky

Číselné soustavy a převody mezi nimi

Java reprezentace dat, výrazy. A0B36PR1-Programování 1 Fakulta elektrotechnická České vysoké učení technické

Informatika Kódování. Obsah. Kód. Radim Farana Podklady předmětu Informatika pro akademický rok 2007/2008

- znakové konstanty v apostrofech, např. a, +, (znak mezera) - proměnná zabírá 1 byte, obsahuje kód příslušného znaku

Číselné soustavy. Jedná se o způsob reprezentace čísel.

ISU Cvičení 1. Marta Čudová

Reprezentace dat. INP 2008 FIT VUT v Brně

Základy jazyka C. Základy programování 1 Martin Kauer (Tomáš Kühr)

Úloha 1 Spojte binární obrazy na obrázku s hodnotami, které reprezentují.

Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/

Úvod do informačních technologií

Informatika I - 5. doc. Ing. Jan Skrbek, Dr. KIN. Spojení: Ing. Bc. Marian Lamr INN

ADT/ADS = abstraktní datové typy / struktury

35POS 2010 Počítačové systémy 1 Úvod, jazyk C Doc. Ing. Bayer Jiří, Csc. Ing. Pavel Píša

2 Ukládání dat do paměti počítače

Zobrazení dat Cíl kapitoly:

Čísla, reprezentace, zjednodušené výpočty

Algoritmizace a programování

Ing. Igor Kopetschke TUL, NTI

Kódování Obsah. Unikátní identifikátory. Radim Farana Podklady pro výuku. Unikátní identifikátory. Kontrolní číslice, GUI,

3 KTE / ZPE Informační technologie

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

Programování v jazyce C pro chemiky (C2160) 12. Specifické problémy při vývoji vědeckého softwaru

Úvod do programování 7. hodina

Programování v jazyce C pro chemiky (C2160) 9. Práce s PDB soubory

Sada 1 - Základy programování

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Informační a komunikační technologie

Znaky. IAJCE Přednáška č. 10. každému znaku je nutné přiřadit nějaké číslo (nezáporné přímé mapování znak <->

Číslo materiálu. Datum tvorby Srpen 2012

Pokročilá algoritmizace amortizovaná složitost, Fibonacciho halda, počítačová aritmetika

B. Sčítání,odčítání adoplňkovýkód

LEKCE 6. Operátory. V této lekci najdete:

Algoritmizace a programování

Úvod do programování - Java

REPREZENTACE DAT. Principy počítačů I. Literatura. Literály. Typy dat. Literály. Čísla Instrukce. Znaky. Logické hodnoty

Systém je citlivý na velikost písmen CASE SENSITIVE rozeznává malá velká písmena, např. PROM=1; PROm=1; PRom=1; Prom=1; prom=1; - 5 různých proměnných

- jak udělat konstantu long int: L long velka = 78L;

Úvod do informačních technologií

VÝRAZY výrazy = operandy prokládané operátory, vyhodnocované podle priority operátorů

UMÍ POČÍTAČE POČÍTAT?

Počítač jako elektronické, Číslicové zařízení

Exponent. Integer 4 bajty až Double Integer 8 bajtů až

BI-JPO (Jednotky počítače) Cvičení

Transkript:

Informatika Datové formáty Radim Farana Podklady předmětu Informatika pro akademický rok 2007/2008 Obsah Datové formáty (datové typy). Textové formáty, vlastnosti zdroje zpráv. Číselné formáty, číselné soustavy. Přesnost uložení čísel. Numerické chyby. Datové formáty (datové typy) Jednoduché Textové (alfanumerické) Číselné celočíselné neceločíselné s pevnou řádovou čárkou s pohyblivou řádovou čárkou Datum a čas Složené Pole Záznam 1

Textové kódy blokové kódy s různou délkou kódového slova a mohutností abecedy, 5 bitů nejstarší kódy, Baudotův kód, kód CCITT, dvě znakové sady po 32 znaků, 7 bitů American Standard Code for Information Interchange ASCII UNIX, 8 bitů ACSII-2, znakové sady (1250) pro různé jazyky, 16 bitů Unicode. Baudotův kód FIGS (US binary hexa LTRS FIGS Bell) 00000 00 -- unused -- 00001 01 E 3 00010 02 LINE LINE FEED FEED 00011 03 A - 00100 04 SPACE SPACE 00101 05 S ' BELL 00110 06 I 8 00111 07 U 7 01000 08 CAR. RET. CAR. RET. 01001 09 D $ 01010 0A R 4 01011 0B J BELL ' 01100 0C N, 01101 0D F! 01110 0E C : 01111 0F K ( 10000 10 T 5 10001 11 Z " 10010 12 L ) 10011 13 W 2 10100 14 H # STOP 10101 15 Y 6 10110 16 P 0 10111 17 Q 1 11000 18 O 9 11001 19 B? 11010 1A G & 11011 1B FIGS FIGS 11100 1C M. 11101 1D X / 11110 1E V ; 11111 1F LTRS LTRS Baudotův telegraf Baudot, Jean-Maurice-Émile * 11. 9. 1845 Magneux, France + 28. 3. 1903 Sceaux, France http://www.converter.cz/fyzici/baudot.htm Kód CCITT CCITT znak kód CCITT znak kód 1 A _ 11000 17 Q 1 11101 2 B? 10011 18 R 4 01010 3 C : 01110 19 S! 10100 4 D vz 10010 20 T 5 00001 5 E 3 10000 21 U 7 11100 6 F 10110 22 V = 01111 7 G 01011 23 W 2 11001 8 H 00101 24 X / 10111 9 I 8 01100 25 Y 6 10101 10 J zv 11010 26 Z + 10001 11 K ( 11110 27 návrat válce 00010 12 L ) 01001 28 posun řádku 01000 13 M. 00111 29 číslicová změna 11011 14 N, 00110 30 písmenová 11111 změna 15 O 9 00011 31 mezera 00100 16 P 0 01101 32 00000 2

ASCII, ISO 8859-1 (Latin-1) Abeceda zdroje Z 26 Mezinárodní telegrafní abeceda: ABCDEFGHIJKLMNOPQRSTUVWXYZ, Z 27 Telegrafní abeceda s mezerou, Z 41 Česká abeceda velkých písmen: AÁBCČDĎEÉĚFGHIÍJKLMNŇOÓPQRŘSŠT ŤUÚŮVWXYÝZŽ, Z 42 Česká abeceda s mezerou, Z 128 Abeceda kódu ASCII znaků (7 bitů), Z 256 Abeceda kódu ASCII-2 (8 bitů). Vlastnosti zdroje Pravděpodobnosti výskytu jednotlivých znaků české abecedy Z 42 A 0,054 F 0,002 Ň 0,015 Ť 0,007 Ž 0,009 Á 0,021 G 0,002 O 0,068 U 0,030 0,163 B 0,014 H 0,020 Ó 0,000 Ú 0,003 C 0,019 I 0,034 P 0,027 Ů 0,002 Č 0,008 Í 0,025 Q 0,000 V 0,039 0,14 Pravděpodobnost výskytu znaků české abecedy Z 26 0,12 Pravděpodobnost 0,1 0,08 0,06 0,04 0,02 0 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 3

Frekvence znaků v češtině kartotéky, soubory znaků, analýza jazyka zdroje zpráv. Slovník spisovné češtiny A B C Č D Ď E F G HCh J K L M N O P Q R Ř S Š I slova v běžném textu A B C D E F G H Ch J K L M N O P Q R Ř Č I kartotéka příjmení A B C Č D Ď E F G I H Ch J K L M N O P Q kartotéka místních jmen C A B Č D F H Ch I J K L M N O P G T S R Ř R Ř U Š S S W V X Y Z Ž poloviny T U V W X Y Z Ž třetiny Š T V U W X Y Z Ž čtvrtiny Š T U V Z Ž pětiny Určení jazyka zdroje Index koincidence I(C)=Σ P(i) 2 Využití v kryptoanalýze Jazyk I (C ) angličtina 0,066895 dánština 0,070731 finština 0,073796 francouzština 0,074604 holandština 0,079805 němčina 0,076667 italština 0,073294 ruština 0,056074 španělština 0,076613 slovenština 0,060270 čeština 0,063600 Textové formáty Znak, Char, Character (1 B) String posloupnost Byte (do 255 B) s pevnou délkou s proměnlivou délkou Memo (až 64 kb adresa 16 bitů). délka znak znak znak znak 0 1 2 3 n 4

Číselné formáty Celočíselné Bit (logický datový typ) Byte (1 B, rozsah 0 255) Integer (2 B) Long Integer (4 B) Racionální, podíl dvou celých čísel Neceločíselné s pevnou řádovou čárkou s pohyblivou řádovou čárkou Číselné soustavy Binární (dvojková) Oktalová (osmičková, 1 znak = 3 b) Šestnáctková (hexadecimální, 4 b) Dekadická (desítková) postupné dělení 18,625 postupné násobení 18 : 2 = 9, Zb. 0 9 : 2 = 4, Zb. 1 4 : 2 = 2, Zb. 0 2 : 2 = 1, Zb. 0 1 : 2 = 0, Zb. 1 10010,101 0,625. 2 = 1,250 0,250. 2 = 0,500 0,500. 2 = 1,000 Číselné kódy Přímý kód znaménko absolutní hodnota Inverzní kód 39-39 záporné + 2 n -1 39-39 8 2 1 39 0 0 1 0 0 1 1 1 1 0 1 0 0 1 1 1 0 0 1 0 0 1 1 1 1 1 0 1 1 0 0 0 Doplňkový kód záporné + 2 n 39-39 8 2 39 0 0 1 0 0 1 1 1 1 1 0 1 1 0 0 1 5

Realizace sčítání Včetně znaménkových bitů. 39= -39= znaménko přenos 00100111 11011001 1 00000000 Problém přetečení rozsahu zobrazitelných čísel (přeplnění) zdvojení znamének znaménko 39= 0 00100111-39= 1 11011001 znaménko 127= 0 01111111 1= 0 00000001 1 0 00000000 0 0 10000000 přenos stejná hodnota znaménka přenos nestejná hodnota znaménka ukazuje na správný výsledek ukazuje na přetečení rozsahu Čísla s pevnou řádovou čárkou Omezená velikost celé části. Omezená přesnost (počet desetinných míst). zn. 2 1 0-1 -2-3 -4 2 2 2 2 2 2 2 2,625 0 0 1 0 1 0 1 0 = 2,625 poloha řádové čárky 2,6 0 0 1 0 1 0 0 1 = 2,5625 Čísla s pohyblivou řádovou čárkou Tvar m.2 e, kde je m mantisa m < 1 e celočíselný exponent Normování mantisy 0,5 m < 1 zn. 2-1 2-2 2-3 2-4 zn. 2 1 2 0 2,625 = 0,65625. 2 +2 0 1 0 1 0 0 1 0 = 2,5 mantisa exponent Skrytý bit (výsledek normování) Uložení hodnoty 0, exponent + 2 n-1 6

Číselné kódy Přímý kód Inverzní kód Doplňkový kód x př x inv x dop x x 0 = x < 1 1 x x < 0 x x 0 = x < 1 n 2 2 + x x < 0 x x 0 = 1 x < 1 2 + x x < 0 Přesnost uložení čísel Počítačové epsilon - nejmenší číslo, zobrazitelné v daném číselném kódu, pro které platí 1,0 + ε > 1,0 Norma uložení IEEE 754 (formát single) 1 8 23 zn exponent + 127 mantisa Typické datové formáty Single 4 B 7 desetinných míst Double 8 B 15 desetinných míst Extended 10 B 19 desetinných míst Datum a čas Datum celá část čísla, počet dnů od referenčního datumu (1. 1. 1900). Čas desetinná část čísla, 1 den = 24 hodin => 1 hodina = 1/24 Výpočty s datumy Problém testování rovnosti datumu a času 7

Složené datové typy Pole (posloupnost prvků stejného datového typu). identifikace pořadím prvku, u vícerozměrného pomocí mapovacích funkcí Adresa 1 2 3 4 n Záznam (množina prvků různých datových typů). identifikace názvem prvku 8