Soubor, souborov e organizace

Podobné dokumenty
Sekven cn soubory. PV 062 Organizace soubor u. Jan Staudek Verze : jaro 2018

Soubor, souborov e organizace

Soubor, souborov e organizace

Hasov an (hashing) na vn ejsch pam etech

Rzen informacn bezpecnosti v organizaci

Rzen informacn bezpecnosti v organizaci

Distribuovan e algoritmy

Obnova transakc po v ypadku

Hierarchick e indexy, B / B+ stromy, tries

Hierarchick e indexy, B / B+ stromy, tries

GPDR, General Data Protection Regulation

Podsyst em vstupu a v ystupu

Uvod, celkov y prehled problematiky

Hierarchick e indexy, B / B+ stromy, tries

Uvod, celkov y prehled problematiky

Obnova transakc po v ypadku

Spr ava hlavn pam eti

Vl akna. PB 152 Operacn syst emy. Jan ÐStaudek Verze : jaro 2015

Prklad dokumentov e z akladny ISMS

Projekt implementace ISMS

Spr ava hlavn pam eti

Operacn syst emy { prehled

Operacn syst emy { prehled

Procesy. PB 152 Operacn syst emy. Jan Staudek Verze : jaro 2017

Projekt implementace ISMS Dodatek 1, PDCA

Typologie, funkcn skladby a architektury OS

Procesy. Uvodem k proces um. PB 152 Operacn syst emy. Program a proces. Uvodem k proces um

Politika informacn bezpecnosti

Vl akna. Proces a vl akna. PB 152 Operacn syst emy. Resen editoru pomoc vl aken. Koncept sekvencnho procesu m uze b yt neefektivn

Projekt implementace ISMS

Poctacov e syst emy { prehled

Typologie, funkcn skladby a architektury OS

Aplikacn bezpecnost. Informacn bezpecnost z pohledu aplikacnch syst em u. PV 017 Bezpecnost informacnch technologi

Audit (prezkoum av an) bezpecnostnch opatren, politik, syst em u,...

Audit (prezkoum av an) bezpecnostnch opatren, politik, syst em u,...

Prepn an, switching. Propojovac probl em. PV 169 Z aklady prenosu dat. Prepnac, prepnan a st' Metody prepn an

Informacn teorie. PV 062 Organizace soubor u. Jan Staudek Verze : jaro 2018

Virtu aln pam et' PB 152 Operacn syst emy. Jan Staudek Verze : jaro 2017

Podsyst em vstupu a v ystupu

Aplikacn bezpecnost. PV 017 Bezpecnost informacnch technologi. Jan Staudek Verze : podzim 2017

Rzen reakc na bezpecnostn incidenty

Kapitola 10: Diskové a souborové struktury. Klasifikace fyzických médií. Fyzická média

Politika informacn bezpecnosti, Dodatek

Politika informacn bezpecnosti, Dodatek

Organizace a zpracování dat I

Organizace a zpracování dat I

Prklady opatren, zranitelnost a hrozeb

Algoritmizace prostorových úloh

4.3 Operace nad ordin ln mi datov mi typy Operace nad logick m datov m typem Operace nad celo seln mi datov mi typy

Volba v udce, Leader Election

Bezs n urov a telefonie, DECT

Volba v udce, Leader Election

Souborov e syst emy { koncepty a rozhran

Principy operačních systémů. Lekce 7: Souborový systém

X u zs speci kace { v etev matematiky zabyvaj. Verze : jaro 2018 Jan Staudek, FI MU Brno. X late Middle English

Projekt implementace ISMS Dodatek 4, Prklad politiky ISMS

Projekt implementace ISMS, Dodatek 2, Pozn amky k projektov emu rzen

Soubory a databáze. Soubor označuje množinu dat, která jsou kompletní k určitému zpracování a popisují vybrané vlastnosti reálných objektů

Pl anov an. PB 152 Operacn syst emy. Jan Staudek Verze : jaro 2017

Souborov e syst emy { koncepty a rozhran

Tabulka symbolů. Vazba (binding) Vazba - příklad. Deklarace a definice. Miroslav Beneš Dušan Kolář

Algoritmizace prostorových úloh

OZD. 2. ledna Logický (Objekty, atributy,...) objekty stejného typu.

N avrh a pouzit metrik informacn bezpecnosti, m eren v ISMS

Distribuovan e prostred, cas a stav v distribuovan em prostred

Anatomie informacn bezpecnosti

Krit eria hodnocen informacn bezpecnosti

Typologie, funkcn skladba a architektury OS, prklady z Windows, Unix, Linux, MAC OSx

Datové struktury 2: Rozptylovací tabulky

projektu implementace ISMS

Rzen rizik. PV 017 Bezpecnost informacnch technologi. Jan Staudek Verze : podzim 2018

Přednáška. Systémy souborů. FAT, NTFS, UFS, ZFS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Organizace a zpracování dat I

Distribuovan e prostred, cas a stav v distribuovan em prostred

Krit eria hodnocen informacn bezpecnosti, dodatek

Ing. Igor Kopetschke TUL, NTI

PA152. Implementace databázových systémů

Typologie, funkcn skladba a architektury OS, prklady z Windows, Unix, Linux, Android

TÉMATICKÝ OKRUH Počítače, sítě a operační systémy

Přednáška 2. Systémy souborů OS UNIX. Nástroje pro práci se souborovým systémem. Úvod do Operačních Systémů Přednáška 2

Digit aln vysl an. PV 169 Z aklady prenosu dat. Jan Staudek Verze : podzim 2018

N avrh a pouzit metrik informacn bezpecnosti, m eren v ISMS

Reprezentace dat v informačních systémech. Jaroslav Šmarda

Sign aly. Data a sign aly. PV 169 Z aklady prenosu dat. Sign al, elektromagnetick y sign al. (Elektromagnetick y) sign al

Transakce, soub eznost a uv aznut v distribuovan em prostred

Databázové systémy I. 1. přednáška

NPRG030 Programování I 3/2 Z --- NPRG031 Programování II --- 2/2 Z, Zk

B azov y fenom en pri zajist'ov an bezpecnosti { riziko

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Digit aln vysl an. K odov an spoje. PV 169 Z aklady prenosu dat. Prvek sign alu, prvek dat, stupe n sign alu. Stupe n dat, baudov a / bitov a rychlost

Spojová implementace lineárních datových struktur

RELAČNÍ DATABÁZOVÉ SYSTÉMY

Sign aly. PV 169 Z aklady prenosu dat. Jan Staudek Verze : podzim 2018

Dynamické datové struktury IV.

Koncept informacn bezpecnosti II

Semestrální práce 2 znakový strom

ADT/ADS = abstraktní datové typy / struktury

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.

Amortizovaná složitost. Prioritní fronty, haldy (binární, d- regulární, binomiální, Fibonacciho), operace nad nimi a jejich složitost

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit

Transkript:

Soubor, souborov e organizace PV 062 Organizace soubor u Jan Staudek http://www..muni.cz/usr/staudek/vyuka/ Ð Û Å«Æ ±²³ µ ¹º»¼½¾ Ý Verze : jaro 2016

Osnova predn asky Pojem soubor, klc, operace se souborem, z aznam Model, sch ema organizace soubor u Dotaz nad souborem Klasikace souborov ych organizac Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 1

Datab aze, soubor, z aznam, polozka (atribut) Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 2

Datab aze, soubor, z aznam, polozka (atribut) z akladn n astroj informacnch sluzeb pro dlouhodob e uchov av an a zprstup nov an dat { datab aze datab aze = kolekce souvisejcch dat vztahy mezi elementy dat v datab azi jsou explicitn datab aze je navrhovan a pro pouzit aplikacnmy syst emy datab aze se v poctaci (na vn ejsch pam etech) uchov avaj jako kolekce pojmenovan ych mnozin dat { soubor u datab aze b yv a spravovan a syst emem rzen b aze dat, kter y je obvykle nez avisl y na operacnm syst emu, m uze vsak vyuzvat radu sluzeb poskytovan ych souc ast OS { syst emem soubor u Syst em rzen b aze dat b yv a souc ast middleware { funkcn vrstvy mezi operacnm syst emem a aplikacnmi syst emy Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 3

Datab aze, soubor, z aznam, polozka (atribut) z akladn prvkem dat je pole, field, resp. polozka (item), resp. atribut, vlastnost (attribute) s kazd ym atributem souvis datov y typ urcujc obor mozn ych hodnot atributu a mnozinu operac nad nimi datov e typy atribut u jsou obvykle standardn datov e typy pouzvan e pri programov an integer, long integer, oating point, Boolean (0/1 nebo TRUE/FALSE), retez znak u (pevn e ci promenn e d elky), speci alne k odovan e datum a cas,... atribut m uze mt xn d elku nebo promennou d elku (ta pak mus b yt explicitne udan a nebo vyznacen a denovan ym odd elovacem) atribut m uze b yt pojmenovan y Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 4

Datab aze, soubor, z aznam, polozka (atribut) b azov a datov a jednotka reprezentujc objekt zpracov avan y aplikac (osoba, mstnost, predmet,... ) je z aznam (redord) z aznam tvor kolekce polozek se kterou aplikacn syst em pracuje jako s jednotkou dat z aznamy jsou tudz chrakterizovateln e sv ymi vlastnostmi, atributy implementacn e jsou z aznamy tvoreny posloupnostmi polozek obsahujcch hodnoty atribut u kolekce identikac polozek a denic jejich typ u vytv ar denici form atu z aznamu, tj. typ z aznamu z aznamy mohou mt pevnou d elku (a pevnou skladbu polozek) z aznamy mohou mt promennou d elku, pokud obsahuj polozky prom enn e d elky nebo pokud maj prom ennou skladbu polozek (pak polozky mus b yt explicitn e pojmenov avan e) a d elka z aznamu b yv a explicitne vyj adrena Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 5

Datab aze, soubor, z aznam, polozka (atribut) soubor (file) je pojmenovan a kolekce z aznam u formujc n ejakou relaci nebo prostor odpovdajc n ejak e trd e soubor je kolekc podobn ych, souvisejcch z aznam u neform alne { soubor je kolekc dat umsten ych na energeticky nez avisl e pameti (disku, p asce, SSD,... ) soubor m uze b yt manipulacn jednotkou stejn e jako z aznam (atributy b yvaj manipulacn jednotkou pouze na urovni aplikace, prpadn e lze pomoc hodnot atribut u vyhled avat z aznamy v souboru, resp. z aznamy v souboru uspor ad avat podle hodnot atribut u) soubory s jednotnou, deklarovatelnou strukturou z aznam u naz yv ame homogenn soubory Soubory, kter e nejsou homogenn, obsahuj z aznamy prom enn eho, nejednotn eho, nedeklarovateln eho typu Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 6

Soubory a vnejs pameti soubory se dlouhodob e uchov avaj v energeticky nez avisl ych vn ejsch pam etch zobrazuj se do blok u/alokacnch blok u/fyzick ych str anek/sektor u/... blok vnejs pameti m uze obsahovat pr ave jeden z aznam, m uze obsahovat vce z aznam u, prp. z aznam m uze b yt uchov avan y ve vce blocch vnejs pameti pro aplikacn manipulace s daty mus b yt prstupn e soubory jako celky { to res adres arov e sluzby syst em u soubor u { jsou implementovan e vesm es jako sluzby operacnho syst emu pro aplikacn manipulace s daty mus b yt rovn ez (efektivn e) prstupn e z aznamy soubor u { to res (standardizovan e prp. propriet arn) organizace soubor u { typicky jsou implementovan e jako knihovn sluzby vyuzvajc b azov e sluzby poskytovan e operacnm syst emem Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 7

Dotaz Prstupn en jist eho z aznamu souboru se res dotazem typu "kde je z aznam udan y v yctem hodnot atribut u / poradm v souboru...?\ pro efektivn resen dotaz u nad soubory a modikac soubor u se soubory dopl nuj { indexy, resp. indexov ymi strukturami, nebo { algoritmick ymi postupy (hasov an), umoz nujcmi efektivn resen dotaz u nad soubory a/nebo navazujcch modikac soubor u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 8

Syst em soubor u, File System sestava sluzeb pro manipulaci se soubory poskytovan e operacnm syst emem prpadn e syst emov ymi programy Syst em soubor u mus (typick e pozadavky) umoznit uzivatel um/proces um manipulaci s daty na vn ejsch pam etech { kazd y u/p m uze vytv aret/rusit/cst/modikovat/... soubory { kazd y u/p m uze rzen ym zp usobem zprstup novat soubory jin ych u/p { kazd y u/p m uze rdit povolen e prstupy k jeho soubor um { kazd y u/p m uze restrukturalizovat sv e soubory, presunovat mezi nimi data,... { kazd y u/p m uze sv a data z alohovat a obnovovat po poruse { kazd y u/p m uze identikovat sv e soubory sv ymi symbolick ymi jm eny zajist'ovat, ze data v souborech jsou validn, eliminovat ztr atu dat optimalizovat v ykon sluzeb z hlediska jak syst emu tak i aplikac podporovat na r uzn ych typech zarzen denovan e API umoznit soub eznou cinnost vce uzivatel u / aplikac Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 9

Prehled b azov ych probl em u souborov ych struktur cl n avrhu souborov ych struktur minimalizace doby prstupu do sekund arn pam eti (disk), tj. minimalizace poctu prstup u na disk { ide alem je 1 prstup / 1 operaci se z aznamem { clem je seskupen informac takov ym zp usobem, ze bude pravd epodobn e, ze zsk ame vse co potrebujeme jedin ym nebo n ekolika m alo mstn e lokalizovan ymi prstupy na disk bez ohledu na rozsah, velikost souboru Statick e dynamick e soubory cl n avrhu souborov ych struktur je relativn e snadno dosaziteln y, pokud soubory jsou statick e, nemen sv uj obsah dosazen cle n avrhu souborov ych struktur je podstatn e obtzn ejs, pokud jsou soubory dynamick e, tj. { doch az k dopl nov an, modikaci a odstra nov an dat (z aznam u) v souboru Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 10

Co vlastn e soubor obsahuje? v tomto predmetu studovan y probl em { jak jsou data organizovan a? popis atribut u / struktury je ulozen obvykle v adres arov e polozce denujc existenci souboru v tomto predmetu nestudovan y probl em { co soubor vlastne obsahuje? popis dat { { implicitn { predpokl ad a se, ze aplikace/uzivatel data zn a { metadata { uveden a typicky v z ahlav souboru, { casto pro danou trdu aplikac standardizovan a, { techniky: klcov a slova, prznaky,... { napr. TIFF, Target Image File Format Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 11

Historie { disky, indexy, stromy pravek (50. { 60. l eta XX. stolet) soubory jen na p ask ach pouze sekvencn prstup cena prstupu byla line arne z avisl a na rozmeru souboru Objev disk u (60. { 70. l eta XX. stolet) moznost nesekvencnho, prm eho prstupu k z aznam um algoritmick ym v ypoctem { hasov anm : adresa-záznamu-na-disku = F (hodnota-klíčové-položky) pomoc index u tvoren ych dvojicemi {hodnota-klíčové-položky, adresa-záznamu-na-disku} { p uvodne ukl adan ych do sekvencne proch azen ych struktur (tabulek) { posl eze objev pouzitelnosti stromu pro implementaci indexu moznost zm eny omezen doby hled an z aznamu line arn funkc na omezen logaritmickou funkc poctu z aznam u v souboru Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 12

Historie { disky, indexy, stromy Objev pouzitelnosti stromu pro implementaci indexu rozs ahl e indexy ulozen e v sekvencn e organizovan ych struktur ach se prohled avaj sekvencn e { tj. dlouho, neefektivn e jiz v 60.letech XX. stolet se objevila idea manipulovat s indexy pomoc stromov ych struktur dobr a myslenka m ela ale nedostatky: { stromy mohou pri prid av an a rusen z aznam u do/v souboru r ust velmi nevyv azene { pro operaci nalezen z aznam u je pak potreba mnoho prstup u na disk a hled an pak trv a ne umerne dlouho Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 13

Historie { disky, indexy, stromy AVL stromy 1963, objev jak umravnit r ust strom u udrzenm (skoro) shodn ych d elek v etv (vyv azenost) vhodn e pro RAM, ne pro disky v uzlu AVL stromu m uze b yt 1 z aznam a ne tucty ci stovky z aznam u AVL strom roste shora dol u { slozit a reorganizace pri vyvazov an stromu B-stromy 70. l eta XX. stolet, dodnes hodn e pouzvan a technika z avislost doby prstupu je O(log k N), N { pocet z aznam u v souboru, k arita uzlu B-stromu lze nal ezt 1 z aznam mezi miliony z aznam u 3 az 4 prstupy na disk B-strom roste zdola nahoru { jednoduss reorganizace pri vyvazov an stromu Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 14

Historie { hasov an na vn ejsch pam etech (statick e) hasov an velmi star a technika zn am a od dob n avrhu prvnch prekladac u (ty ale resily hasov an v RAM pameti { pr ace s tabulkou identik ator u) omezen na 3 { 4 prstupy na disk / 1 operaci je dobr y v ysledek clem je vsak 1 prstup na disk / 1 operaci tento cl lze pomoc hasov an dos ahnout relativn e snadno pro statick e, tj.,,t em er xn"soubory dynamick e hasov an technika z konce 80. a 90. let XX. stolet zarucuje 1 { 2 prstupy na disk / 1 operaci bez ohledu na to, jak se men pocet z aznam u v souboru Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 15

Zpracov an dat ulozen ych v souborech po z aznamech Aplikace si uchov avaj logicky souvisejc data na vn ejs pam eti organizovan e po souborech Aplikace si zprstup nuj data uchov avan e v souborech po z aznamech informace o osobe, predmetu, oddelen,... po t e, co si aplikace zprstupn z aznam, m uze opravit hodnotu jist eho atributu operacemi na urovni procesoru a hlavn pam eti a z aznam zpetne zapsat na vnejs pamet' dlc atributy na disku si aplikace nezprstup nuje izolovan e z aznam = mnozina polozek, kter e spolu souvis, polozka { atribut, vlastnost jde o logickou notaci v souborov e strukture casto plat z aznam datov y objekt a z apis / cten z aznamu uklid / obnova datov eho objektu Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 16

Z aznamy pevn e / promenn e d elky metody vycle nov an z aznam u v souboru / polozek v z aznamu implicitn (xn) d elka z aznam u { neuv adej se oddelovace z aznam u variabiln d elka z aznamu se vyjadruje: { explicitn e, hodnotou udanou napr. na poc atku z aznamu, { oddelovacem na konci z aznamu, { ukazatelem na z aznam v prim arnho souboru s aplikacnmi daty ulozen ym v nejak em sekund arnm souboru (v indexu) xn struktura polozek { neuv ad ej se odd elovace polozek v z aznamu variabiln d elka polozky se vyjadruje: { explicitn e, hodnotou udanou napr. na poc atku polozky, { odd elovacem na konci polozky, pr ace s promenn ymi d elkami zvysuje pamet'ovou n arocnost Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 17

Z aznamy pevn e / promenn e d elky Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 18

Proc se pouzv a promenn a d elka z aznam u? obsahuj polozky prom enn e d elky P RIJMENI, BYDLIST E,... nekter a polozka se v z aznamu vcekr at opakuje z aznam obsahuje seznam hodnot nekter a polozka v z aznamu je deklarovan a jako voliteln a soubor obsahuje z aznamy, jejichz polozkami mohou b yt z aznamy tzv. clustered records, mixed file Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 19

Terminologick e pozn amky z aznam = kolekce atribut u (polozek) charakterizujcch jist y objekt logick y z aznam { kolekce hodnot atribut u vytv arejcch z aznam fyzick y z aznam { m a d elku R kolekce hodnot atribut u vytv arejcch z aznam (tj. logick y z aznam) + denice d elek atribut u, oddelovace atribut u,... Denice d elek atribut u atributy konstantn d elky { ta obvykle b yv a implicitn atributy promenn e d elky { { nedenovan e d elky, d elka je vymezen a oddelovacem { denovan e d elky, vyjadrovan e explicitn e (pocet bit u/pocet byt u) pamet'ov y prostor pro zobrazen z aznamu ve vnejs pameti { blok pamet'ov y prostor pro zobrazen atributu ve vnejs pameti { pole Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 20

Blokov an z aznam u blok vnejs pameti nebo tak e fyzick a str anka vnejs pameti samostatn e manipulovateln a, resp. adresovateln a datov a jednotka je predmetem I/O prenos u podporovan ych OS a prov aden ych jako celek, m a d elku B Vztah z aznam { blok neblokovan y z aznam { blok obsahuje pr ave jeden (fyzick y) z aznam { smyslem je jednoduch a manipulace { 1 IO operace / 1 z aznam blokovan e z aznamy { blok obsahuje/,,blokuje"celistv y pocet z aznam u, blokovac faktor b = B/R, kde R je d elka z aznamu kde ξ znac nejvyss cel e cslo ξ { clem je efektivita vyuzv an pam et'ov eho prostoru prerostl e z aznamy { fyzick e z aznamy jsou zapisovan e do blok u bez ohledu na hranice blok u ve vnejs pameti { cast e resen pro soubory se z aznamy promenn e d elky, napr. zdrojov e textov e soubory,... Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 21

Blokovane a p rerostle zaznamy Jan Staudek, FI MU Brno PV 062, Souborove systemy { organizace 22

Soubor, homogenn soubor, nehomogenn soubor soubor { identikovateln a kolekce logicky souvisejcch z aznam u v souboru mohou b yt i totozn e z aznamy homogenn soubor hodnoty polozek jeho z aznam u jsou primitivn (nestrukturovan e) typy je deklarovateln y formou S(A 1 : D 1,..., A n : D n ), (jméno-atributu:doména-hodnot) tj. obsahuje z aznamy jednoho typu nehomogenn soubor hodnoty polozek jeho z aznam u nejsou primitivn typy nebo z aznamy nejsou jednoho typu nehomogenn soubory nejsou predm etem studia v PV062 Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 23

Klc klc, key { c ast z aznamu, polozka(y), identikujc z aznam kdyz hled ame konkr etn z aznam, mnohdy identikujeme hledan y z aznam jeho obsahem nikoli poradm v souboru klc souboru, k j, je mnozina atribut u A j1,... A jm, m je pocet atribut u zahrnut ych do klce k j, m n, n je pocet atribut u z aznamu mnozina klc u souboru { vsechny mozn e klce souboru homogenn soubor S lze ch apat jako klcov y typ Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 24

Klc prim arn klc identikuje z aznam jedinecn e pokud se jako prim arn klc vol jeden klc z mnoziny klc u souboru, mus jeho atributy sv ymi hodnotami identikovat jednotliv e z aznamy jednoznacn e { soubor mus b yt mnozina v ide alnm prpad e, by prim arn klc nem el obsahovat aplikacne z avisl a data { mel by b yt tzv. dataless key sekund arn klc, resp. vyhled avac klc nebo tak e pomocn y klc jeden klc z mnoziny vsech klc u souboru sekund arn klc nemus z aznam identikovat jednoznacn e Typy klc u hodnotov y { nab yv a hodnoty z dom en atribut u, kter e ho tvor hasovan y { algoritmick a transformace hodnotov eho klce relativn { pozice z aznamu vzhledem k poc atku souboru Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 25

Operace se souborem Soubor ch apan y jako abstraktn datov y typ, ADT konstruktory / destruktor { vytvoren / zrusen souboru CREATE, BUILD, REMOVE modik atory { aktualizace souboru vlozen z aznamu { INSERT, (PUT) rusen z aznamu { DELETE modikace polozek z aznamu { UPDATE, (WRITE), (MODIFY) inspektory { zsk an z aznamu ze souboru ze souboru do vnitrn pam eti { READ, (FETCH), (GET) dotaz { QUERY, (FIND) generov an zpr avy { LIST udrzba souboru restrukturalizace, reorganizace { REORGANIZATION, OPEN, CLOSE Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 26

Dotaz nad souborem tot aln vycsliteln a funkce denovan a na universu souboru prklad: odpověd = FETCH (soubor, klíč) odpoved' = z aznam nebo kolekce z aznam u jednorozm ern y dotaz jednoatributov y klc Trdy vcerozm ern ych (ortogonálních) dotaz u na uplnou shodu { zad ano vsech n atribut u na c astecnou shodu { zad ano s n atribut u na uplnou intervalovou shodu { zad ano vsech n atribut u { pro kazd y atribut je d an interval mozn ych hodnot na c astecnou intervalovou shodu { zad ano s n atribut u { pro kazd y atribut je d an interval mozn ych hodnot Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 27

Model, sch ema organizace soubor u Hierarchick a abstrakce organizace soubor u ve 3 urovnch Cíl { umoznit optim aln e resit operace nad z aznamy souboru nez avisle na konkr etnm fyzick em zarzen vn ejs pam eti Logick e sch ema ex. hypotetick a logick a pam et' se strukturou optimalizovanou tak, aby umoznila efektivn resen operac nad z aznamy logick a pamet' se clen na logick e str anky, LS, ty mohou b yt uspor adan e sekvencne, hierarchicky,... logick a pam et' obsahuje { jednak prim arn soubor { aplikacn data { jednak sekund arn (pomocn e) soubory { indexy, rejstrky,... z aznamy prim arnho souboru i sekund arnch soubor u mohou b yt v logick ych str ank ach blokovan e (vce z aznam u v 1 LS) { blokovac faktor, resp. faktor napln en (logick e) str anky: λ = skutecn y pocet z aznam u v LS / mozn y pocet z aznam u v LS Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 28

Model, sch emata organizace soubor u Logick e sch ema, pokracov an cíl { poskytnout takovou pam et'ovou strukturu, kter a umozn minimalizovat pocet operac prov ad en ych pri manipulacch (insert, delete, search,... ) se z aznamy souboru umsten ymi v logick ych str ank ach popis na urovni typ u { { vztahy mezi logick ymi str ankami { vnitrn struktura logick e str anky { algoritmy operac s logick ymi str ankami pri zprstup nov an dat a pri udrzb e jejich struktury, { operace s logick ymi str ankami { stepen str anky, sl ev an str anek { stanoven mez faktoru naplnen logick e str anky,... Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 29

Logick e sch ema organizace soubor u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 30

Fyzick e sch ema Fyzick e sch ema organizace soubor u zobrazen logick ych str anek do fyzick ych str anek konkr etnho, pouzit eho typu vn ejs pam eti Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 31

Logick e a fyzick e sch ema organizace soubor u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 32

Implementacn sch ema organizace soubor u Implementacn sch ema rozmst en, alokace fyzick ych str anek v pouzit em zarzen u klasick ych organizac soubor u implementovan ych na sdlen ych discch standardn e res OS nez avisle na aplikacch aplikace res ve v yjimecn ych prpadech na dedikovan ych discch slozitost sch ematu organizace soubor u prostorov a { potrebn y objem fyzick ych str anek pro zobrazen soubor u casov a { pocet V/V operac s fyzick ymi str ankami pro jednotliv e operace s logick ymi str ankami { pocet nactan ych fyzick ych str anek (do RAM) { pocet zapisovan ych fyzick ych str anek (do zarzen) Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 33

Model, sch emata organizace soubor u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 34

Model, sch emata organizace soubor u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 35

Klasikace souborov ych organizac Souborov a organizace se sekvencnm prstupem k z aznam um aplikovateln a na p asce, na disku slozitost dotazu { prstupu k z aznamu s udan ym klcem { je line arn, O(N), slozitost dotazu { prstupu k z aznamu s udan ym klcem { v prpad e pouzit bin arnho hled an v setrd en em souboru podle vyhled avacho klce, je logaritmick a, O(log 2 N) Souborov a organizace s prm ym prstupem k z aznam um aplikovateln a na disku urcen msta se z aznamem lze dos ahnout pomoc indexu urcen msta se z aznamem lze dos ahnout pomoc hasov an Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 36

Souborov a organizace s prm ym prstupem k z aznam um s urcenm msta se z aznamem pomoc indexu index { sekvencn struktura uspor ad an ukazatel u na z aznamy { tabulka/pole/seznam dvojic {klíč, ukazatel na záznam}) { slozitost pr uchodu takov ym indexem je line arn az logaritmick a (pri pouzit bin arnho hled an v setrd en em indexu podle klc u) index { stromov a struktura uspor ad an ukazatel u na z aznamy { vyv azen e (balanced) stromy, B stromy / B+ stromy, { slozitost log k N, k >> 2, i pro dynamick e soubory, { B stromy { ztr ata moznosti sekvencnho prstupu { B+ stromy umoz nuj i sekvencn prstup, s urcenm msta se z aznamem pomoc hasov an algoritmick ym odvozenm ukazatele z aznamu z hodnoty klce konstantn slozitost Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 37

{ ulozen z aznamu i Z aznam i se uloz pocnaje bytem n (i 1), kde n je rozmer z aznamu { prstup k z aznam um po kroku n, trivi aln operace, pokud hranice z aznam u sleduj hranice blok u { rusen z aznamu i, alternativy: Operace se z aznamy pevn e d elky a) presun z aznam u i + 1,..., m do mst i,..., m 1 b) presun z aznamu m do msta i c) nic se nepresouv a, voln a msta se retez do seznamu voln ych mst Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 38

Z aznamy pevn e d elky, retezen z aznam u rusen z aznamu { pouzit seznamu voln ych mst Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 39

Z aznamy promenn e d elky prklad reprezentace z aznam u prom enn e d elky v souboru se z aznamy s n asobne opakovan ymi polozkami na konci kazd eho z aznamu se uvede oddelovac (rdic znak, jedinecn y bitov y vzorek,... ) End-Of-Record ( ) obtzn e rusen a dopl nov an z aznam u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 40

Z aznamy promenn e d elky reprezentace z aznam u promenn e d elky kapsou z aznam u v bloku (slotted page, slotted block) blok = záhlaví, volné místo, záznamy z ahlav = počet záznamů v kapse, ukazatel na konec volného místa, ukazatel a délka každého záznamu voln e msto se udrzuje souvisl e ukazatele v adres ari neukazuj prmo na z aznam, ukazuj na ukazatel z aznamu v z ahlav kapsy Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 41

Z aznamy promenn e d elky reprezentace z aznam u promenn e d elky pomoc rezervovan eho prostoru modul = prostor pro z aznam se zn amou maxim aln d elkou nevyuzit y prostor lze vyplnit symbolem null nebo End-Of-Record Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 42

Z aznamy promenn e d elky reprezentace z aznam u promenn e d elky pomoc ukazatel u z aznam promenn e d elky je reprezentov an seznamem generick ych z aznam u pevn e d elky retezen ych ukazateli v yhoda { pouziteln e i pri neznalosti maxim aln d elky z aznamu Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 43

Z aznamy promenn e d elky nedostatek pouzit ukazatel u v predchozm prkladu uchov avaj se pr azdn e, nevyuziteln e prostory resen { 2 typy blok u, kotva, anchor { obsahuje 1. z aznamy retezc u, pretoky, overflow { obsahuje ostatn z aznamy ret ezc u Jan Staudek, FI MU Brno PV 062, Souborov e syst emy { organizace 44