Informatika / file system KIT.PEF.CZU
kódování znaků Vlastní návrh kódování Chci psát text a napsané chci uložit pro další použití. Co udělám? Odhadnu počet symbolů, které budu chtít kódovat (nezbytný kódovací rozsah) Nadefinuji kódovací tabulku (tj. převod mezi symboly a čísly) např.: A = 1 0 = 70 B = 2 1 = 71 C = 3 2 = 72 apod.
kódování znaků To za nás už udělali Pro potřeby přenosu informace pomocí dálnopisu byly navrženy různé způsoby kódování. Některé kódy byly sekvenčně závislé (význam kódu se lišil podle toho, co předcházelo) - např. u EIA kódu Svou jednoduchostí a jednoznačností se prosadilo kódování ASCII. I když nevyhovuje dnešním požadavkům (kódování národních jazyků), je dobrým společným výchozím standardem. ASCII - American Standard Code for Information Interchange
file system (správa souborů) Vlastní řešení ANIČKO MOJE,.. EVIČKO, LÁSKO.. napíšu text, symboly převedu do číselných kódů, mám magnetofonovou pásku, kódy nahraji napíšu další text, uložím ho vznikne problém, když správně nerozliším rozhraní uložených textů proto vsunu nezaměnitelný kód, jako příznak konce textu
file system (správa souborů) Vlastní řešení a1 ANIČKO MOJE,.. e1 EVIČKO, EVIČKO, LÁSKO.. LÁSKO.. ANČO a2hloupá,.. ANČO HLOUPÁ,.. až budu mít hodně pásek plných textů, budu s obtížemi rozpoznávat hledaný text pro snadnější orientaci předřadím před každý záznam jakýsi identifikátor obsahující jméno nebo poznámku, jaká data následují pokud k identifikátoru přidružím i údaj o délce záznamu, bude příznak konce záznamu zbytečný
file system (správa souborů) Vlastní řešení a1 e1 a2 a1 200 ANIČKO MOJE,.. e1 120 EVIČKO, LÁSKO.. a2 837 ANČO HLOUPÁ,.. takže nyní rozpoznám text už podle identifikátoru a začátek dalšího záznamu odvodím z délky chtěl bych ale včas vědět, jestli hledaná data na pásce vůbec najdu, abych ji zbytečně nepřevíjel to by šlo zařídit tak, že bych na začátek pásky umístil seznam identifikátorů - asi takhle ještě lepší by bylo odstranit duplicitu a kompletní informace o datech shromáždit do jedné tabulky
Vlastní řešení adresář a1 200 e1 120 a2 837. file system (správa souborů) FAT - file allocation table directory - (adresář) ANIČKO MOJE,.. EVIČKO, LÁSKO.. ANČO HLOUPÁ,.. mohu navrhnout např. tabulku pevné délky (čili bude předem řečeno, jaký je maximální počet souborů, které lze na pásku uložit; budou-li soubory krátké, zůstane velký kus pásky nevyužit, protože v tabulce už není místo pro informaci o dalším souboru) tato strategie je využita např. při ukládání dat na disketu nebo i na disk u systémů ukládajících soubory pomocí tzv. FAT tabulky tabulce, v níž se udržují informace o uložených datech se říká adresář
a jak to za nás vyřešili file system (správa souborů) prostor na disketě, disku, mgf. pásce se rozdělí na vhodně velké úseky stejné velikosti - clustery vytvoří se tabulka v níž se udržuje seznam neobsazených clusterů navrhne se vhodná struktura, umožňující udržovat důležité informace o jednotlivých souborech (jako název souboru, počáteční cluster, čas vzniku/změny, příznaky stavu, práva přístupu, velikost...) vytvoří se soubor obsahující vhodný počet takových záznamů, tj. tabulka pro zaznamenání informací o souborech
...D...D jméno,...d -volnojméno,...u -volnojméno,...d -volnojméno,...u -volno jméno,...s -volno jméno,...s -volnojméno,...u -volnojméno,...d nějaká systémová data nějaká moje data...d...d -volnojméno,...u -volnojméno,...d -volno jméno,...u -volno jméno,...s jméno,...s jméno,...u -volnojméno,...u jméno,...d jméno,...u -volnojméno,...u -volnojméno,...s nějaká moje data jsou-li velká -volnojméno,...u -volnojméno,...d -volno jméno,...u -volno root directory (základní/kořenový adresář) a jak to za nás vyřešili root pomocí FAT
ještě o FAT tabulce file system (správa souborů) FAT tabulka obsahuje řetězce neobsazených clusterů a clusterů použitých při ukládání jednotlivých souborů. Integrita dat je zajištěna jednoznačností a správností těchto řetězců. Odolnost proti závadě je zvýšena zdvojením. FAT tabulka se udržuje ve dvou kopiích. Je přípustný stav, kdy soubor je uložen v clusterech, které netvoří na disku souvislé pole.
c:\dopisy\soukr\anicka35.txt path (cesta k souboru) cesta k souboru písmeno s dvojtečkou udává (logické) zařízení a:, c:... samotné zpětné lomítko \ udává kořenový (root) adresář jméno s lomítkem dirname\ udává podadresář (zpětné lomítko má význam oddělovače názvů) zástupné symboly: - tečka. nahrazuje název aktuálního adresáře - dvě tečky.. nahrazují název nejblíže nadřazeného adresáře (nelze použít v root adresáři) - hvězdička * je žolík, znamená všechny možnosti - otazník? je žolík, znamená jakékoliv písmeno
Jsou i jiné konstrukce FS Windows podporují: FAT (File Allocation Table), NTFS (New Technology File System) Linux a Unix: XFS, Ext2FS, ReiserFS a řadu dalších Při rušení souboru se zpravidla ruší jen příslušná položka v adresáři (tj. zaniká logická vazba mezi identifikátorem souboru a konkrétním úložným místem), ale obsah úložného místa se obvykle nemění. To poskytuje možnost obnovy smazaných dat, se všemi kladnými i zápornými důsledky.
dotazy?